Dômyselný prístup k AI obmedzuje sady zaujatých údajov

Predpojaté súbory údajov a etická AI

Riešenia poháňané AI potrebujú súbory údajov, aby boli účinné. A vytváranie týchto súborov údajov je na systematickej úrovni spojené s problémom implicitnej zaujatosti. Všetci ľudia trpia zaujatosťou (vedomou aj nevedomou). Predsudky môžu mať rôzne podoby: geografické, lingvistické, sociálno-ekonomické, sexistické a rasistické. A tieto systematické predsudky sú zapracované do údajov, čo môže mať za následok produkty AI, ktoré zachovávajú a zväčšujú zaujatosť. Organizácie potrebujú starostlivý prístup na zmiernenie predsudkov, ktoré sa vkrádajú do súborov údajov.

Príklady, ktoré ilustrujú problém zaujatosti

Jedným z pozoruhodných príkladov tohto skreslenia súboru údajov, ktorý v tom čase vyvolal veľa negatívnej tlače, bolo riešenie na čítanie životopisov, ktoré uprednostňovalo mužských kandidátov pred ženami. Je to preto, že súbory údajov náborového nástroja boli vyvinuté pomocou životopisov za posledné desaťročie, keď väčšinu uchádzačov tvorili muži. Údaje boli skreslené a výsledky odrážali toto skreslenie. 

Ďalší široko uvádzaný príklad: Na výročnej vývojárskej konferencii Google I/O spoločnosť Google zdieľala ukážku dermatologického asistenčného nástroja poháňaného AI, ktorý pomáha ľuďom pochopiť, čo sa deje s problémami súvisiacimi s ich pokožkou, vlasmi a nechtami. Asistent dermatológie podčiarkuje, ako sa AI vyvíja, aby pomáhala so zdravotnou starostlivosťou – ale tiež zdôraznila potenciál zaujatosti preniknúť do AI v dôsledku kritiky, že tento nástroj nie je vhodný pre ľudí inej farby pleti.

Keď spoločnosť Google oznámila tento nástroj, spoločnosť poznamenala:

Aby sme sa uistili, že vytvárame pre každého, náš model zohľadňuje faktory ako vek, pohlavie, rasa a typ pleti – od bledej pokožky, ktorá sa neopáli, až po hnedú pokožku, ktorá sa spáli len zriedka.

Google pomocou AI na pomoc pri hľadaní odpovedí na bežné stavy kože

V článku vo Vice sa však uvádza, že spoločnosti Google sa nepodarilo použiť inkluzívny súbor údajov:

Na splnenie úlohy výskumníci použili tréningový súbor údajov 64,837 12,399 obrázkov 3.5 90 pacientov nachádzajúcich sa v dvoch štátoch. Ale z tisícok zobrazených kožných ochorení len XNUMX percenta pochádzalo od pacientov s Fitzpatrickovým typom pokožky V a VI – ktoré predstavujú hnedú pokožku a tmavohnedú alebo čiernu pokožku. Podľa štúdie XNUMX percent databázy tvorili ľudia so svetlou pokožkou, tmavšou bielou pokožkou alebo svetlohnedou pokožkou. V dôsledku skresleného odberu vzoriek dermatológovia tvrdia, že aplikácia by mohla skončiť nadmernou alebo nedostatočnou diagnostikou ľudí, ktorí nie sú bieli.

Vice, nová aplikácia pre dermatológiu od spoločnosti Google nebola navrhnutá pre ľudí s tmavšou pleťou

Spoločnosť Google reagovala vyhlásením, že tento nástroj pred oficiálnym vydaním vylepší:

Náš dermatologický asistenčný nástroj poháňaný AI je vyvrcholením viac ako trojročného výskumu. Odkedy bola naša práca uvedená v Nature Medicine, pokračovali sme vo vývoji a zdokonaľovaní našej technológie začlenením ďalších súborov údajov, ktoré zahŕňajú údaje darované tisíckami ľudí a milióny ďalších upravených obrázkov týkajúcich sa pokožky.

Google pomocou AI na pomoc pri hľadaní odpovedí na bežné stavy kože

Akokoľvek by sme mohli dúfať, že AI a programy strojového učenia dokážu tieto predsudky napraviť, realita zostáva: sú len také chytrý pretože ich súbory údajov sú čisté. V aktualizácii starého príslovia o programovaní odpad dnu odpad vonRiešenia umelej inteligencie sú od začiatku len také silné, aká silná je kvalita ich súborov údajov. Bez korekcie od programátorov tieto súbory údajov nemajú skúsenosti na pozadí, aby sa samy opravili – pretože jednoducho nemajú žiadny iný referenčný rámec.

Zodpovedné vytváranie súborov údajov je jadrom všetkého etická umelá inteligencia. A ľudia sú jadrom riešenia. 

Mindful AI je etická AI

Zaujatosť sa nedeje vo vákuu. Neetické alebo skreslené súbory údajov pochádzajú z nesprávneho prístupu vo fáze vývoja. Spôsob, ako bojovať proti chybám zo zaujatosti, je prijať zodpovedný prístup zameraný na človeka, ktorý mnohí v tomto odvetví nazývajú Mindful AI. Mindful AI má tri dôležité komponenty:

1. Mindful AI je zameraná na človeka

Od začiatku projektu AI musia byť vo fázach plánovania potreby ľudí v centre každého rozhodnutia. A to znamená, že všetci ľudia – nielen podskupina. Preto sa vývojári musia spoliehať na rôznorodý tím globálne založených ľudí, ktorí budú trénovať aplikácie AI, aby boli inkluzívne a nezaujaté.

Crowdsourcing súborov údajov z globálneho, rôznorodého tímu zaisťuje včasné rozpoznanie a filtrovanie zaujatostí. Ľudia z rôznych etnických skupín, vekových skupín, pohlaví, úrovne vzdelania, sociálno-ekonomického zázemia a lokality môžu ľahšie rozpoznať súbory údajov, ktoré uprednostňujú jeden súbor hodnôt pred iným, čím sa odstránia neúmyselné predsudky.

Pozrite sa na hlasové aplikácie. Pri aplikácii vedomého prístupu AI a využívaní sily globálneho fondu talentov môžu vývojári zohľadniť jazykové prvky, ako sú rôzne dialekty a akcenty v súboroch údajov.

Vytvorenie dizajnového rámca zameraného na človeka od začiatku je rozhodujúce. Ide o dlhú cestu k zabezpečeniu toho, aby generované, spracované a označené údaje spĺňali očakávania koncových používateľov. Je však tiež dôležité udržiavať ľudí v obraze počas celého životného cyklu vývoja produktu. 

Ľudia v slučke môžu tiež pomôcť strojom vytvoriť lepší zážitok z AI pre každé konkrétne publikum. V spoločnosti Pactera EDGE naše tímy dátových projektov AI, ktoré sa nachádzajú na celom svete, chápu, ako môžu rôzne kultúry a kontexty ovplyvniť zhromažďovanie a spracovanie spoľahlivých údajov o školeniach AI. Majú potrebné nástroje, ktoré potrebujú na označovanie problémov, ich monitorovanie a odstraňovanie predtým, ako bude uvedené riešenie založené na AI do prevádzky.

Human-in-the-loop AI je projektová „záchranná sieť“, ktorá spája silné stránky ľudí – a ich rôznorodé zázemie s rýchlym výpočtovým výkonom strojov. Táto spolupráca medzi ľuďmi a umelou inteligenciou musí byť vytvorená od začiatku programov, aby skreslené údaje netvorili základ v projekte. 

2. Všímavá AI je zodpovedná

Byť zodpovedný znamená zabezpečiť, aby systémy AI neboli predpojaté a aby boli založené na etike. Je to o uvedomení si toho, ako, prečo a kde sa údaje vytvárajú, ako ich syntetizujú systémy AI a ako sa používajú pri rozhodovaní, rozhodnutiach, ktoré môžu mať etické dôsledky. Jedným zo spôsobov, ako to môže podnik dosiahnuť, je pracovať s nedostatočne zastúpenými komunitami, aby boli inkluzívnejšie a menej zaujaté. V oblasti anotácií údajov nový výskum zdôrazňuje, ako model viacerých úloh s viacerými anotátormi, ktorý zaobchádza s menovkami každého anotátora ako so samostatnou podúlohou, môže pomôcť zmierniť potenciálne problémy spojené s typickými metódami základnej pravdy, kde nezhody anotátorov môžu byť spôsobené nedostatočným zastúpením a môžu byť ignorované pri agregácii anotácií do jednej základnej pravdy. 

3. Dôveryhodné

Dôveryhodnosť pochádza z podnikania, ktoré je transparentné a vysvetliteľné v tom, ako sa model AI školí, ako funguje a prečo odporúčajú výsledky. Podnik potrebuje odborné znalosti v oblasti lokalizácie AI, aby svojim klientom umožnil urobiť ich aplikácie AI inkluzívnejšími a prispôsobenejšími, rešpektujúc kritické nuansy v miestnom jazyku a používateľských skúsenostiach, ktoré môžu zvýšiť alebo narušiť dôveryhodnosť riešenia AI z jednej krajiny do druhej. . Podnik by mal napríklad navrhovať svoje aplikácie pre prispôsobené a lokalizované kontexty vrátane jazykov, dialektov a prízvukov v aplikáciách založených na hlase. Vďaka tomu aplikácia prináša rovnakú úroveň náročnosti na hlasové zážitky v každom jazyku, od angličtiny po nedostatočne zastúpené jazyky.

Spravodlivosť a rozmanitosť

V konečnom dôsledku vedomá AI zaisťuje, že riešenia sú postavené na spravodlivých a rôznorodých súboroch údajov, kde sa dôsledky a vplyv konkrétnych výsledkov monitorujú a vyhodnocujú predtým, ako sa riešenie dostane na trh. Tým, že sme pozorní a zapájame ľudí do každej časti vývoja riešenia, pomáhame zabezpečiť, aby modely AI zostali čisté, minimálne zaujaté a čo najviac etické.

Čo si myslíte?

Táto stránka používa Akismet na zníženie spamu. Zistite, ako sa spracúvajú údaje vašich komentárov.