2,7 miljard mensen – meer dan een derde van alle mensen op aarde – gebruiken Facebook. Dat is een duizelingwekkend cijfer! Ondanks zijn alomtegenwoordigheid, is de centrale rol van AI – niet alleen handgeschreven code – waarschijnlijk onzichtbaar voor de meeste gebruikers. In een recente aflevering van de Intel on AI-podcast spreekt gastheer Abigail Hing Wen met Jerome Pesenti, hoofd AI bij Facebook, om meer te weten te komen over hoe het bedrijf AI vandaag gebruikt en wat het van plan is in de toekomst te doen.

“In een plek als Facebook wordt AI de afgelopen jaren al enorm ingezet en het groeit enorm snel. Maar het is niet per se erg zichtbaar voor de eindgebruiker.”

-Jerome Pesenti

Hoe AI Facebook-gebruikers beïnvloedt

In de podcast vertelt Jerome hoe Facebook AI gebruikt om zijn platform op drie belangrijke gebieden te verbeteren:

  1. Gebruikers verbinden met inhoud-De inhoud die wordt weergegeven in gebruikersfeeds in zowel de Facebook- als Instagram-applicaties wordt bepaald door een geavanceerd algoritme dat probeert de gebruiker beter te begrijpen en waarin ze geïnteresseerd zijn, en probeert vervolgens inhoud te vinden die overeenkomt met die interesses met het einddoel van het algoritme is dat gebruikers een langetermijnwaarde zien in interactie met de applicatie. De infrastructuur hierachter is fascinerend: servers in een bepaalde regio leveren overdag inhoud aan gebruikers en schakelen (als gebruikers in slaap vallen) over op training over de ervaringen van de dag om nieuwe modellen te creëren die klaar zijn om nieuwe inhoud te leveren wanneer gebruikers weer wakker worden. Het uitstekende infrastructuurdocument van Facebook is boeiend om te lezen.
  2. Berichten beheren—Een ander algoritme analyseert elk bericht (tekst, afbeeldingen of video) om ervoor te zorgen dat de inhoud voldoet aan het beleid van Facebook met betrekking tot pornografie, aanzetten tot haat en gewelddadige inhoud. Het systeem moet kijken naar de totaliteit van de post, niet alleen de tekst, niet alleen de metadata, niet alleen de afbeelding, maar alles bij elkaar, wat vooral lastig kan zijn bij het analyseren van afbeeldingen die zijn bedekt met tekst. Als het algoritme niet zelf kan beslissen of een bericht in strijd is met het beleid van het platform, wordt het bericht doorgestuurd naar een van de 30.000 mensen die zich toeleggen op het modereren van het platform. De voordelen van de moderatiesystemen van Facebook reiken buiten het platform: Facebook detecteert routinematig materiaal van seksueel misbruik van kinderen dat is geüpload door gebruikers over de hele wereld, en door dit materiaal te rapporteren aan de relevante autoriteiten, speelt het een sleutelrol bij het opsporen van strafbare feiten tegen kinderen. Een hoogtepunt van mijn eigen tijd bij Intel was mijn aandeel in het gebruik van AI om het National Center for Missing and Exploited Children te helpen Facebook-rapporten door te sturen naar gespecialiseerde politie-eenheden over de hele wereld.
  3. Nieuwe ervaringen creëren
  4. —Facebook investeert in augmented reality (AR), aangedreven door AI in de kern, zodat mensen naadloos kunnen communiceren met een set AR-brillen en de bril ook de wereld om de gebruiker kan begrijpen. Op een dag kun je bijvoorbeeld aan je AR-bril vragen: “Waar heb ik mijn sleutels gelaten?” Om dat soort AI-interactie mogelijk te maken, moet Facebook verschillende lokale verwerkings- en privacyproblemen oplossen. Er zijn echter al tekenen van vooruitgang, nu Facebook's Portal-product machine learning-modellen lokaal uitvoert voor soepelere en gebruiksvriendelijkere videogesprekken.

Hoe Facebook AI-onderzoek en -engineering bevordert

Luisteren naar deze specifieke aflevering is alsof je een kijkje krijgt in een echt krachtig, industrieel AI-onderzoekslaboratorium. Hoewel het werk van Jerome en zijn team op zeer eenvoudige manieren duidelijke waarde biedt voor Facebook, is de code die ze open-sourcen enorm waardevol en vindt toepassingen op allerlei plaatsen, zowel voor winst als voor non-profit. Facebook financiert een onderzoeksoutfit die evenveel hoogwaardig onderzoek, open-sourcecode en vooraf opgeleide modellen produceert als een topuniversiteit. Voorbeelden hiervan zijn Fasttext, een ongelooflijk krachtige bibliotheek voor tekstclassificatie, en Faiss, een “semantische zoekfunctie” waarmee zeer snel stukken tekst, afbeeldingen of audio kunnen worden gevonden die op elkaar lijken (d.w.z. “laat me een afbeelding zien die er zo uitziet ”). Dergelijke tools zijn zo waardevol dat ze kernonderdelen zijn geworden van de machine learning-toolchain bij veel externe bedrijven en non-profitorganisaties.

Facebook is in feite een case-study over hoe onderzoek te doen dat nieuwe wegen inslaat en nieuwe wetenschap vertalen naar nieuwe functies en producten; heel weinig organisaties doen een van deze dingen, laat staan ​​beide.

Facebook is niet tevreden met het zelf produceren van uitstekend onderzoek: Jerome vertelt hoe de academische onderzoeksgemeenschap betere datasets nodig heeft om ook AI verder te ontwikkelen. Facebook creëert dus uitdagingen voor het openbaar maken van datasets en algoritmen. De Deepfake Detection Challenge creëert en deelt een unieke nieuwe dataset van meer dan 100.000 video's voor experts van over de hele wereld om hun detectiemodellen te benchmarken en van elkaars werk te leren. De Hateful Memes-dataset bevat meer dan 10.000 nieuwe multimodale voorbeelden gemaakt door Facebook AI, en bevat een prijzenpot van $ 100.000 als onderdeel van de NeurIPS 2020-competitietrack.

Sociale media en de verantwoordelijkheid van schaal

Zoals oom Ben tegen Peter Parker in de Spider-Man-stripboeken zei: “Met grote kracht komt grote verantwoordelijkheid.” En gezien de steeds centralere rol die sociale media spelen in de samenleving, zijn onze verwachtingen van Facebook terecht gegroeid, zij het niet altijd op een geheel consistente manier. We verwachten hoge normen op het gebied van inhoudsfiltratie en -moderatie, maar ook sterke bescherming van privacy. Luisteren naar de uitdagingen waarmee Jerome wordt geconfronteerd bij het voldoen aan deze concurrerende zorgen, temperde mijn afgunst voor de middelen waarover hij beschikt.

In dezelfde podcastaflevering spreekt Abigail met Sam Small van ZeroFOX over hoe sociale media nieuwe veiligheidsbedreigingen hebben gecreëerd. Sam vertelt hoe de financiële dienstverlening vanuit meerdere invalshoeken kwaadwillenden moet bestrijden. Iemand kan bijvoorbeeld een opmerking of een stuk inhoud plaatsen met betrekking tot een negatieve ervaring met een financiële dienst om een ​​reactie van het bedrijf uit te lokken. De financiële dienst moet ervoor zorgen dat het account met de klacht zich niet voordoet als een echte klant, en valse bedrijfsaccounts afweert die zich voordoen als klantenservicemedewerkers die aanbieden om te “helpen” door phishing-links te verstrekken of om privégegevens te vragen.

Wanneer er elke dag mogelijk duizenden van deze aanvallen plaatsvinden, staat het beveiligingsteam van een financiële instelling voor een echte uitdaging bij het classificeren en prioriteren van welke van deze risico's het eerst moeten worden aangepakt en welke de meeste schade kunnen veroorzaken. ZeroFox wendt zich tot gespecialiseerde AI, met name de Intel®-distributie van OpenVINO™ Toolkit voor sommige computervisie-algoritmen en objectdetectie om sneller prestatieverbeteringen te bereiken dan het gebruik van industriestandaard frameworks en bibliotheken. Als uw bedrijf diepe neurale netwerken op de CPU gebruikt, kunt u waarschijnlijk aanzienlijke prestatievoordelen behalen door (automatisch) TensorFlow- of PyTorch-modellen naar OpenVINO te converteren nadat ze zijn getraind. Voor meer details kun je onze Intel Select Solutions for AI Inference bekijken.

De toekomst van AI op Facebook

Zoals geldt voor de meeste afleveringen van Intel over AI, vraagt ​​Abigail Jerome naar zijn mening over de toekomst van AI. En zoals Pieter Abbeel in zijn aflevering over slimme robots besprak, ziet Jerome 'zelf-gecontroleerd' of 'niet-gesuperviseerd' leren als de weg om AI-systemen meer als mensen te laten leren. Hij merkt op dat tegenwoordig de meeste AI-systemen die worden vrijgegeven, worden getraind met een gigantische hoeveelheid supervisie-gelabelde gegevens, wat ongunstig afsteekt tegen de vele gevallen in de “natuurlijke wereld” van “one-shot” leren – zoals kernachtig uitgedrukt door niet minder een autoriteit dan een van de grootste auteurs uit de geschiedenis:

“Als een kat op een hete kachel zit, zal die kat niet meer op een hete kachel zitten. Die kat zal ook niet op een koud fornuis zitten. Die kat houdt gewoon niet van kachels.”

-Mark Twain

Miljoenen gelabelde trainingsvoorbeelden zijn ook beschikbaar voor het trainen van spamfilters, maar het crashen van een paar miljoen zelfrijdende auto's als trainingsoefening is een niet-starter (net als mijn oude auto!). Het verhogen van de leerefficiëntie tot het punt waarop machines de intellectuele gelijken van de gemiddelde huiskat worden, is nog ver weg, maar het is cruciaal om de volledige belofte van AI in de fysieke wereld te realiseren.

Jerome ziet AI ook helpen veel natuurlijkere interacties met machines creëren. Hij geeft het voorbeeld van het toetsenbord – een opzettelijk vreselijke interface die we zelf hebben aangepast om te gebruiken, in plaats van dat de machine zich aan ons aanpast. Jerome ziet computers zich meer aanpassen aan de mens – het gereedschap naar de hand vormen in plaats van andersom. En zoals elke tool die eerder kwam, nieuwe creatieve mogelijkheden vrijgeven.

Meer weten? Al enkele jaren beschouw ik de artikelen van Facebook AI als verplichte lectuur, en dat zou jij ook moeten doen!

Ga voor meer informatie over Intel's werk op het gebied van AI naar: https://intel.com/ai

Als je meer podcasts over AI wilt horen, waaronder een aflevering met de legendarische AI-pionier Yann LeCun en een andere met het creatieve team dat het Marvel-personage Thanos tot leven heeft gebracht in Avengers: Endgame, vind je je favoriete streamingplatform op: https://www.intel.com/content/www/us/en/artificial-intelligence/podcast.html

Edward Dixon
Data Scientist, Intel

0

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *