# Etikos šališkumo stebėjimo variklis realaus laiko saugumo anketoms

## Kodėl šališkumas svarbus automatizuotuose anketų atsakymuose  

Greitas DI pagrįstų įrankių priėmimas saugumo anketų automatizavimui atnešė beprecedentį greitį ir nuoseklumą. Tačiau kiekvienas algoritmas paveldi savo kūrėjų prielaidas, duomenų pasiskirstymą ir dizaino sprendimus. Kai šios paslėptos nuostatos iškyla kaip **šališkumas**, jos gali:

1. **Iškraipyti pasitikėjimo balus** – Tiekėjai iš tam tikrų regionų ar pramonės šakų gali nuosekliai gauti žemesnius balus.  
2. **Iškraipyti rizikos prioritetizavimą** – Sprendimų priėmėjai gali paskirstyti išteklius remdamiesi šališkomis signalais, atskleidžiant organizaciją paslėptoms grėsmėms.  
3. **Nuslopinti klientų pasitikėjimą** – Pasitikėjimo puslapis, atrodo, teikia pirmenybę tam tikriems tiekėjams, gali pakenkti prekės ženklo reputacijai ir pritraukti reguliatorių įsikišimą.

Ankstyvas šališkumo aptikimas, jo priežasties paaiškinimas ir automatinis šalinimas yra būtini siekiant išlaikyti teisingumą, reguliacinę atitiktį ir DI pagrįstų atitikties platformų patikimumą.

## Pagrindinė Etikos šališkumo stebėjimo variklio (EBME) architektūra

EBME sukurtas kaip **prijungiamas mikro‑paslauga**, įsiterpianti tarp DI anketų generatoriaus ir vėlesnio pasitikėjimo balų skaičiuoklio. Jo aukšto lygio srautas parodytas „Mermaid“ diagramoje:

```mermaid
graph TB
    A["Įeinantys DI‑generuoti atsakymai"] --> B["Šališkumo aptikimo sluoksnis"]
    B --> C["Paaiškinamojo DI (XAI) pranešėjas"]
    B --> D["Realio laiko šalinimo variklis"]
    D --> E["Pakoreguoti atsakymai"]
    C --> F["Šališkumo skydelis"]
    E --> G["Pasitikėjimo balų paslauga"]
    F --> H["Atitikties auditoriai"]
```

### 1. Šališkumo aptikimo sluoksnis  

- **Savybių lygiateisiškumo patikrinimai**: Palyginti atsakymų pasiskirstymą pagal tiekėjų atributus (regionas, dydis, pramonė) naudojant Kolmogorovo‑Smirnovo testus.  
- **Grafų neuroninio tinklo (GNN) teisingumo modulis**: Naudoja žinių grafiką, susiejantį tiekėjus, politiką ir anketų elementus. GNN išmoksta įterpimus, kurie yra *de‑šališkinti* per priešinamosios mokymo metodą, kur diskriminatorius bando prognozuoti apsaugomas savybes iš įterpimų, o koduotojas stengiasi jas paslėpti.  
- **Statistiniai slenksčiai**: Dinaminiai slenksčiai prisitaiko prie įeinančių užklausų apimties ir variacijos, užkertant kelią klaidingiems signalams mažos apkrovos periodais.

### 2. Paaiškinamojo DI (XAI) pranešėjas  

- **SHAP briaunų priskyrimas**: Kiekvienam pažeistam atsakymui apskaičiuojamos SHAP reikšmės GNN briaunų svoriams, kad būtų parodyta, kurios sąsajos labiausiai prisidėjo prie šališkumo balo.  
- **Pasakojamos santraukos**: Automatiškai generuojami lietuvių kalbos paaiškinimai (pvz., „Žemesnis rizikos įvertinimas tiekėjui X yra paveiktas istorinių incidentų skaičiaus, kuris koreliuoja su jo geografinėmis vietovėmis, o ne su faktine kontrolės brandos lygiu.“) saugomi neredaguojamoje audito traukelėje.

### 3. Realio laiko šalinimo variklis  

- **Šališkumui jautrus perskaičiavimas**: Pridedamas korekcinis koeficientas prie neapdoroto DI pasitikėjimo, pagrįstas šališkumo signalo dydžiu.  
- **Užklausos regeneravimas**: Siunčiamas patobulintas užklausos tekstas atgal į LLM, tiesiogiai nurodant „ignoruoti regioninius rizikos proxy“ perversti atsakymą.  
- **Nulinės žinios įrodymai (ZKP)**: Kai šalinimo žingsnis pakeičia balą, sukuriamas ZKP, patvirtinantis korekciją neatskleidžiant žaliųjų duomenų, taip patinant privatumo jautrias audito reikalavimus.

## Duomenų srautas ir žinių grafų integracija  

EBME įkelia duomenis iš trijų pagrindinių šaltinių:

| Šaltinis               | Turinys                                            | Dažnumas          |
|------------------------|----------------------------------------------------|-------------------|
| Vendor Profile Store   | Struktūruoti atributai (regionas, pramonė, dydis) | Įvykių pagrindu   |
| Policy & Control Repository | Tekstiniai politikos punktai, susiejimai su anketų elementais | Dienos sinchronizacija |
| Incident & Audit Log   | Istoriniai saugumo incidentai, auditų rezultatai  | Realio laiko srautas |

Visos entitetų reprezentacijos – **savybių grafas** (Neo4j arba JanusGraph). Briaunos atspindi santykius, pvz., *„įgyvendina“*, *„pažeidžia“* ir *„nuorodo“*. GNN tiesiogiai veikia šiame heterogeniame grafike, leidžiant šališkumui vertinti **kontekstines priklausomybes** (pvz., tiekėjo atitikties istorija įtakoja atsakymus į duomenų šifravimo klausimus).

## Nuolatinis grįžtamojo ryšio ciklas  

1. **Aptikimas** → 2. **Paaiškinimas** → 3. **Šalinimas** → 4. **Audito peržiūra** → 5. **Modelio atnaujinimas**  

Po auditoriaus patvirtinimo šalinimas, sprendimas įrašomas. Periodiškai **meta‑mokymosi modulis** perskaito šiuos patvirtintus atvejus, atnaujindamas GNN ir LLM užklausų strategiją, užtikrindamas, kad šališkumo šalinimo logika evoliucionuotų kartu su organizacijos rizikos apetitu.

## Veikimo ir mastelio galimybės  

- **Vėlavimas**: Galutinis šališkumo aptikimo ir šalinimo procesas priduria ~150 ms vienam anketų elementui, todėl vis dar patenkina <1 sekundės [SLA](https://www.ibm.com/think/topics/service-level-agreement) daugumos SaaS atitikties platformų.  
- **Perdavimo sparta**: Horizontali skalė per Kubernetes leidžia apdoroti >10 000 lygiagrečių elementų, dėl būsenos‑nepriklausomos mikro‑paslaugos dizaino ir dalinamų grafų momentinių kopijų.  
- **Kaina**: Pasitelkiant **krašto inferenciją** (TensorRT arba ONNX Runtime) GNN, GPU naudojimas neviršija 0,2 GPU‑valandų milijonui elementų, sukuriant nuolatinį biudžetą.

## Realiosios srities pavyzdžiai  

| Pramonė   | Šališkumo simptomas                                                   | EBME veiksmas                                      |
|-----------|-----------------------------------------------------------------------|-----------------------------------------------------|
| FinTech   | Perteklinis tiekėjų iš besivystančių rinkų baudimas dėl istorinių sukčiavimo duomenų | Pritaikyti GNN įterpimus, ZKP pagrįsti balų koregavimai |
| HealthTech| Pirmenybė teikti tiekėjams su ISO 27001 sertifikatu nepaisant faktinės kontrolės brandos | Užklausos perkūrimas, reikalaujantis pagrįsto įrodymų požiūrio |
| Cloud SaaS| Regioniniai vėlavimo metrikos subtiliai daro įtaką „prieinamumo“ atsakymams | SHAP skatintas pasakojimas, akcentuojantis ne priežastinę koreliaciją |

## Valdymas ir atitikties suderinimas  

- **EU AI Act**: EBME atitinka „aukštos rizikos DI sistemos“ dokumentavimo reikalavimus, suteikdamas sekamą šališkumo vertinimą ([EU AI Act Compliance](https://digital-strategy.ec.europa.eu/en/policies/regulatory-framework-ai)).  
- **ISO 27001** priedas A.12.1: Demonstruoja sisteminį rizikos valdymą DI pagrįstiems procesams ([ISO/IEC 27001 Information Security Management](https://www.iso.org/isoiec-27001-information-security.html)).  
- **SOC 2** Pasitikėjimo paslaugų kriterijai – CC6.1 (Sistemos keitimo valdymas) įvykdyti per neredaguojamus šališkumo korekcijų audito žurnalus ([SOC 2](https://secureframe.com/hub/soc-2/what-is-soc-2)).

## Įgyvendinimo kontrolinis sąrašas  

1. **Paruoškite savybių grafiką** su tiekėjų, politikos ir incidentų mazgais.  
2. **Įdiekite GNN teisingumo modulį** (PyTorch Geometric arba DGL) kaip REST endpoint.  
3. **Integruokite XAI pranešėją** per SHAP bibliotekas; saugokite santraukas nerekordų žurnale (pvz., Amazon QLDB).  
4. **Sukonfigūruokite šalinimo variklį**, kad iškvietų jūsų LLM (OpenAI, Anthropic ir t.t.) su šališkumui pritaikytomis užklausomis.  
5. **Nustatykite ZKP generavimą** naudojant `zkSNARKs` ar `Bulletproofs` bibliotekas, kad audituojami įrodymai būtų paruošti.  
6. **Sukurkite skydelius** (Grafana + Mermaid) šališkumo metrikoms rodyti atitikties komandai.  

## Ateities kryptys  

- **Federacinis mokymasis**: Išplėsti šališkumo aptikimą daugių nuomininkų aplinkose neišskleidžiant žaliųjų tiekėjo duomenų.  
- **Multimodalus įrodymas**: Įtraukti nuskaitytus politikos PDF ir video patikrinimus į grafiką, praturtinant teisingumo kontekstą.  
- **Automatinė reguliavimo gavyba**: Į kaskart nusiųsti regulacinių pokyčių srautus (pvz., iš RegTech API) į grafiką, prognozuojant naujus šališkumo vektorinius prieš juos išryškinant.

---

## See Also  

* *(No additional references)*