Klíčové jídlo
- Facebook vytvořil technologii AI, která dokáže „vidět“ fotografie, na které se dívá na Instagramu.
- Tento projekt AI používá nezpracovaná data k tomu, aby model mohl trénovat sám, protože si prohlíží více obrázků.
- Odborníci tvrdí, že tento druh umělé inteligence by mohl prospět zrakově postiženým uživatelům na sociálních médiích a lépe rozpoznat škodlivé obrázky nebo videa než lidský moderátor.
Technologie SEER
Facebook uvedl, že SEER (který vychází ze SElf-supERvised) byl schopen překonat stávající modely AI v testu rozpoznávání objektů. Podle společnosti sociálních médií dokázala SEER dosáhnout 84,2% přesnosti v obrazových testech. Facebook uvedl, že je zaměřen na druh technologie AI, která se může učit samostatně, bez pomoci algoritmu. „Budoucnost AI spočívá ve vytváření systémů, které se mohou učit přímo z jakýchkoli informací, které dostanou – ať už jde o text, obrázky nebo jiný typ dat – aniž by se spoléhaly na pečlivě vybrané a označené datové sady, aby je naučily rozpoznávat objekty v fotografii, interpretovat blok textu nebo provádět jakýkoli z nesčetných dalších úkolů, o které ji žádáme, “napsali výzkumní pracovníci Facebooku v příspěvku na blogu. „Používání vašich fotografií a dat k vytváření lepšího softwaru je jednou z lepších věcí, které může Facebook s vašimi daty udělat.“ Moore dále prolomil, jak se SEER liší od technologie AI, na kterou jsme obvykle zvyklí. „Největším rozlišovacím prvkem tohoto nového modelu SEER je to, že Facebook využívá velmi velké množství nezpracovaných dat a umožňuje modelu trénovat sám – na rozdíl od manuálního výběru modelů s omezenými datovými sadami,“ řekl Moore. Dodal, že použití surového datového souboru by mohlo poskytnout přesnější předpovědi rozpoznávání v reálném světě. „Nezpracované datové sady mohou také pomoci snížit předsudky zabudované do modelů rozpoznávání zabudovaných do omezených datových sad,“ dodal Moore.
Jak lze SEER použít
Prozatím je SEER pouze výzkumným projektem. Odborníci přesto tvrdí, že vývoj společnosti SEER by mohl připravit půdu pro všestrannější, přesnější a adaptabilnější modely počítačového vidění a zároveň přinést uživatelům sociálních médií lepší nástroje pro vyhledávání a přístupnost. Jedním z nástrojů, které by z této technologie mohly velmi těžit, je generovaný text pro popis obrázků lidem se zrakovým postižením. „Alt-text je pole v metadatech obrázku, které vysvětluje jeho obsah:„ Tělo stojící v poli se slonem “nebo„ pes na lodi “,“ napsal Will Cannon, generální ředitel společnosti Signaturely, v e-mailu Záchranný drát. „Vylepšený systém by měl být pastvou pro zrakově poškozené uživatele a v budoucnu vám může pomoci při rychlejším hledání obrázků.“ Mezi další užitečné aplikace pro tuto technologii by mohla patřit lepší automatická kategorizace položek prodávaných na Facebooku Marketplace a přesnější systémy pro identifikaci škodlivých obrázků.