Hackeři se snaží vylepšovat umělou inteligenci

GettyImages 1314526623 1f12aee34ef84815b5a3e3beb7fbe4d2

Klíčové věci

Nový kolektiv vývojářů vytváří modely umělé inteligence s otevřeným zdrojovým kódem.
Skupina využívá masivní modely jazykového vzdělávání, které bude vydávat pod otevřenými licencemi.
Umělá inteligence s otevřeným zdrojovým kódem by mohla pomoci snížit potenciál nové technologie, která mění hru, ke zkreslení a chybám.

Velké společnosti (AI) zkoumají umělou inteligenci hodně, ale jedna online skupina chce tento proces demokratizovat. EleutherAI je nedávno vytvořený kolektiv dobrovolných výzkumníků, inženýrů a vývojářů zaměřených na open-source výzkum umělé inteligence. Organizace využívá kódové základny GPT-Neo a GPT-NeoX k trénování masivních jazykových modelů, které plánuje vydávat pod otevřenými licencemi. „Data z otevřených zdrojů jsou pro výzkumníky přínosná, protože vědci mají více volných zdrojů, které mohou použít k trénování modelů a dokončení výzkumu,“ řekl Edward Cui, generální ředitel společnosti Graviti pro umělou inteligenci, Lifewire v e-mailovém rozhovoru. Jeho společnost není zapojena do EueutherAI. „Víme, že mnoho projektů umělé inteligence bylo zdrženo obecným nedostatkem vysoce kvalitních dat ze skutečných případů použití, takže je nezbytné vytvořit pokyny, které zajistí kvalitu dat, s pomocí zúčastněné komunity.“

Toto je ta cesta

Začátky EleutherAI byly skromné. Minulý rok jmenoval nezávislý výzkumník AI Connor Leahy zveřejnil na serveru Discord následující zprávu: „Hey guys lets [SIC] dejte OpenAI za své peníze jako za starých dobrých časů.“ A tak vznikla skupina. Nyní má stovky přispěvatelů, kteří zveřejňují svůj kód na online softwarovém úložišti GitHub. Snahy o AI s otevřeným zdrojem nejsou nic nového. Platforma pro řízení pracovních toků Airflow společnosti Airbnb a engine pro zjišťování dat Lyft jsou ve skutečnosti výsledky používání nástrojů s otevřeným zdrojovým kódem, které datovým týmům umožňují lépe pracovat s daty, poukázal Ali Rehman, projektový manažer softwarové společnosti CloudiTwins v e-mailovém rozhovoru pro Lifewire. „Stejně jako revoluce v oblasti open source vedla k transformaci vývoje softwaru, tak také vedla k rozvoji a demokratizaci datové vědy a umělé inteligence,“ řekl Rehman. vědecká řešení, přičemž většina datových vědců používá nástroje s otevřeným zdrojovým kódem.“

Otevírání dveří

Někteří pozorovatelé tvrdí, že vývoj umělé umělé inteligence s otevřeným zdrojovým kódem by mohl pomoci snížit potenciál nové technologie, která mění hru, ke zkreslení a chybám. Výzkum AI se nyní primárně odehrává v otevřeném prostoru, přičemž téměř všechny společnosti, výzkumné laboratoře a univerzity prezentují své výsledky okamžitě v odborných publikacích, řekl Kush Varshney, výzkumník AI z IBM, Lifewire v e-mailovém rozhovoru. „Tato otevřená komunita je nezbytná, protože poskytuje zvýšenou úroveň kontrol a protiváh, aby bylo zajištěno, že AI je zkoumána, vytvářena, nasazována a aplikována zodpovědně,“ dodal Varshney. „To je obzvláště důležité v situacích, kdy tyto systémy mohou ovlivnit životy našich nejzranitelnějších členů společnosti. Tato otevřenost se nevztahuje pouze na obecné strojové učení a algoritmy hlubokého učení, ale také na prvky důvěryhodné umělé inteligence.“ Rehman řekl, že jedním z kritických rozdílů mezi proprietárním a open-source softwarem je flexibilita a přizpůsobení. Proprietární výzkum AI bude mít problémy se zabezpečením, aktualizacemi a optimalizacemi.

„Je to proto, že přístup založený na komunitě s otevřeným zdrojovým kódem získává cenné informace od tisíců odborníků z oboru, kteří identifikují potenciální zranitelnosti zabezpečení, které jsou pak rychleji odstraněny,“ dodal Rehman. „Konsensus komunity znamená, že kvalita je zaručena a nové příležitosti jsou snadněji identifikovány.“ Dalším problémem je, že proprietární výzkum AI nebude interoperabilní, což znamená, že nemůže pracovat s různými formáty dat a pravděpodobně bude mít uzamčení dodavatele, což společnostem brání v testování a zkoušení softwaru před tím, než se zaváže k řešení, řekl Rehman. Ale ne každý aspekt výzkumu AI musí být open source, řekl Chris Kent, generální ředitel lékařské společnosti Reveal Surgical, Lifewire v e-mailovém rozhovoru. „Je důležité chránit ekonomické pobídky, které řídí komerční vývoj klíčových aplikací umělé inteligence,“ řekl. Nicméně výzkum AI potřebuje robustní open-source komponentu, řekl Kent. Dodal, že open source pracuje na budování důvěry a využívání datových sad, které nejsou nebo by neměly být kontrolovány jednotlivými institucemi nebo společnostmi. „Přístup s otevřeným zdrojovým kódem je nejlepší způsob, jak identifikovat a kompenzovat základní zkreslení, které může existovat v tréninkových sadách, a povede k holističtějším, kreativnějším a spolehlivějším aplikacím AI,“ řekl Kent.