Gall AI Facebook ddadansoddi memes, ond a all eu deall? Mae technoleg Rosetta Facebook yn dadansoddi biliynau o ddelweddau sy'n cynnwys testun, ond mae memes yn rhy gymhleth ar gyfer deallusrwydd artiffisial. Mae biliynau o destunau, lluniau a fideos yn cael eu huwchlwytho i gyfryngau cymdeithasol bob dydd. Mae hon yn gyfoeth o wybodaeth na all safonwyr dynol a'u gwirwyr ffeithiau fynd trwyddi, ei rheoli a'i rheoli'n gynhwysfawr. Mae cwmnïau fel Facebook a YouTube wedi dibynnu ers tro ar ddeallusrwydd artiffisial i gadw sbam, trais, cynnwys beirniadol a phornograffi oddi ar eu platfformau!
Gall rhywbeth fel meme system-feirniadol heb destun fod yn anodd i'w uwchgyfrifiaduron a'u algorithmau ei ddadansoddi a'i brosesu, gan fod y dasg hon yn gofyn am gyfrifo sawl elfen weledol wahanol ar yr un pryd. Mae'n rhaid i systemau awtomataidd, fel y'u gelwir yn systemau bot, adnabod a “darllen” y geiriau uwchben y llun yn ogystal â dadansoddi a phennu'r ddelwedd ei hun. Gellir disgrifio memes hefyd fel arteffactau diwylliannol cymhleth sy'n anodd eu deall y tu allan i'r cyd-destun. Er gwaethaf yr heriau y maent yn eu cyflwyno, mae pob prif lwyfan cymdeithasol eisoes yn defnyddio AI i reoli memes, gan gynnwys Facebook, sy'n defnyddio teclyn o'r enw Rosetta i ddadansoddi lluniau a fideos sy'n cynnwys testun a chapsiynau.
Yn ôl Facebook, mae Rosetta eisoes yn cael ei ddefnyddio i ganfod cynnwys sy'n torri canllawiau lleferydd casineb yn awtomatig. Gyda chymorth Rosetta, mae Facebook yn ymdrechu i reoli cynnwys defnyddwyr gan gynnwys lluniau a fideos ac nid postiadau testun yn unig. Mae Rosetta yn cefnogi'r broses lle mae'n cael ei wirio'n awtomatig a yw delweddau a fideos sy'n cynnwys testun wedi'u marcio'n rhai "hanfodol". Mae Rosetta yn cyfuno technoleg OCR (adnabod nodau optegol) â thechnegau dysgu peiriant eraill i weld, prosesu, dosbarthu a aseinio testun i mewn ac ar ffotograffau a fideos ac yna ei gadw. Yn gyntaf, defnyddir OCR i benderfynu lle mae'r testun mewn meme neu fideo. Mae hyn yn caniatáu iddynt drawsnewid data yn gyflym a defnyddio eu “detholwyr” i werthuso'r cynnwys.
Unwaith y bydd Rosetta yn gwybod ble mae'r geiriau, mae Facebook yn defnyddio rhwydwaith niwral sy'n gallu deall y testun, ei drawsgrifiad a'i ystyr. Yna gellir trosglwyddo'r testun hwn trwy systemau eraill, megis system sy'n gwirio a yw'r meme yn neges firaol sydd eisoes wedi'i dadbacio yn unol â'u canllawiau. Mae datblygwyr ac ymchwilwyr Rosetta yn honni y gall yr offeryn nawr dynnu testun o unrhyw ddelwedd a uwchlwythwyd yn gyhoeddus i Facebook mewn amser real ac adnabod y testunau yn ogystal â "darllen" eu dynodwyr iaith, gan gynnwys Saesneg, Sbaeneg, Almaeneg ac Arabeg.
Gall Rosetta hefyd ddadansoddi delweddau sy'n cynnwys testun mewn llawer o wahanol ffurfiau, megis lluniau o arwyddion protest, bwydlenni bwyty, ffenestri siopau, a mwy. Dywedodd Viswanath Sivakumar, peiriannydd meddalwedd yn Facebook sy'n gweithio ar Rosetta, mewn e-bost fod yr offeryn yn gweithio'n dda ar gyfer adnabod testun mewn tirwedd fel arwydd stryd ac ar gyfer memes - ond mae'r olaf yn fwy heriol. “Yng nghyd-destun mynd ati’n rhagweithiol i ganfod lleferydd casineb a chynnwys arall sy’n torri polisïau, mae delweddau ar ffurf meme yn cyflwyno’r her AI fwy cymhleth,” ysgrifennodd.
Yn wahanol i fodau dynol, fel arfer mae angen i AI hefyd weld degau o filoedd o enghreifftiau cyn y gall ddysgu cwblhau tasg gymhleth, meddai Sivakumar. Ond nid yw memes yn anfeidrol o reolaeth, hyd yn oed ar gyfer Facebook, a gall casglu a storio digon o enghreifftiau mewn gwahanol ieithoedd ac emosiynau hefyd fod yn anodd. Mae dod o hyd i negeseuon o ansawdd uchel yn her barhaus i ymchwil deallusrwydd artiffisial yn ehangach. Yn aml mae angen labelu ac archifo data yn ofalus â llaw. Mae llawer o gronfeydd data hefyd yn cael eu diogelu gan hawlfraint.
Er mwyn bwydo Rosetta â'r data angenrheidiol a hyfforddi ei ddefnyddioldeb, cyfunir testun, ynghyd â'i gapsiynau a'r lleoliadau y cawsant eu cyhoeddi ohonynt, yn broses gyfrifiadol. Mewn geiriau plaen, rydych chi wedi creu rhaglen i greu'r union enghreifftiau hynny y mae eu cynnwys yn ymddangos yn amheus. Mae hyn yn golygu bod y broses gyfan yn awtomataidd i raddau: mae un rhaglen yn poeri'r memes yn awtomatig ac un arall yn ceisio eu dadansoddi. Bydd AI yn wynebu heriau mawr iawn. Er enghraifft, mae Rosetta yn wynebu ieithoedd fel Arabeg, a ddarllenir o'r dde i'r chwith, yn hytrach nag ieithoedd eraill fel Saesneg neu Almaeneg. Mae Rosetta yn “darllen” Arabeg am yn ôl, yna mae Facebook yn gwrthdroi'r cymeriadau ar ôl prosesu. Mae'r tric hwn yn gweithio'n rhyfeddol o dda ac yn caniatáu ar gyfer model unedig sy'n gweithio ar gyfer ieithoedd chwith-i-dde a dde-i-chwith.
Gall systemau awtomataidd fod yn hynod ddefnyddiol ar gyfer cymedroli cynnwys a gwirio ffeithiau, ond nid ydynt bob amser yn hawdd. Er enghraifft, mae WeChat yn defnyddio dau algorithm gwahanol i hidlo delweddau. Mae'r cyntaf, rhaglen sy'n seiliedig ar OCR, yn hidlo lluniau sy'n cynnwys testun ar bynciau gwaharddedig, tra bod y lleill yn sensro delweddau tebyg i'r rhai ar restr ddu sy'n debygol o gael eu creu gan lywodraeth China. Trwy hidlwyr WeChat, gallwch chi gael gwared ar nodweddion delwedd yn hawdd, yn ogystal â'r lliwio neu'r cyfeiriadedd wedi'i newid. Mae Rossetta ar Facebook yn gymhleth, ond mae'n debyg nad yw'n berffaith. Gall testun anodd ei ddarllen neu ffontiau gwyrgam osgoi'r system. Mae'r holl algorithmau adnabod delweddau hefyd yn dal i fod yn agored i enghreifftiau sy'n gwrthdaro, delweddau wedi'u newid ychydig sy'n edrych yr un peth i fodau dynol ond sy'n achosi dryswch i AI.
Mae Facebook a llwyfannau eraill fel Twitter, YouTube a Reddit o dan bwysau aruthrol i blismona rhai mathau o gynnwys mewn sawl gwlad. Yn 2018, cynigiodd yr Undeb Ewropeaidd gyfreithiau newydd a fyddai’n ei gwneud yn ofynnol i gwmnïau cyfryngau cymdeithasol gael gwared ar bostiadau terfysgol o fewn awr i hysbysiad neu wynebu dirwyon. Mae Rosetta ac offer awtomataidd tebyg eraill eisoes yn helpu Facebook a llwyfannau eraill i gydymffurfio â chyfreithiau tebyg mewn gwledydd fel yr Almaen. Ac maen nhw'n gwella yn eu swyddi: Ddwy flynedd yn ôl, dywedodd y Prif Swyddog Gweithredol Mark Zuckerberg mai dim ond tua hanner y cynnwys a dynnwyd gan y cwmni y mae systemau AI Facebook yn rhagweithiol yn rhyng-gipio. Mae'n rhaid i bobl nodi'r gweddill yn gyntaf. Yn ôl Facebook, mae ei offer AI yn canfod bron i 100 y cant o'r sbam y maent yn ei gondemnio, yn ogystal â 99,5 y cant o gynnwys terfysgol ac 86 y cant o drais graffig. Mae platfformau eraill fel YouTube wedi cael llwyddiant tebyg gyda systemau adnabod cynnwys awtomataidd.
Fodd bynnag, nid yw hyn yn golygu bod systemau AI fel Rosetta yn ateb perffaith, yn enwedig o ran ffurfiau mwy cynnil o fynegiant. Yn wahanol i fwydlen bwyty, gall fod yn anodd dadansoddi ystyr meme heb wybod y cyd-destun y cafodd ei bostio ynddo. Dyna pam mae gwefannau cyfan yn eu hesbonio. Mae memes yn aml yn cynnwys jôcs neu'n benodol iawn i isddiwylliant ar-lein penodol a'i gefndir moesol a moesegol. Ac nid yw deallusrwydd artiffisial yn gallu deall meme na fideo o hyd fel y byddai person. Am y tro, bydd Facebook yn dal i orfod dibynnu ar gymedrolwyr dynol a'u gwirwyr ffeithiau i wneud penderfyniadau ynghylch a ddylid tynnu meme.
Erthygl gyfieithiad o gylchgrawn Wired Medi 14.09.2018, XNUMX

(Via Vale Rion)





Mae "Dravens Tales from the Crypt" wedi bod yn hudolus ers dros 15 mlynedd gyda chymysgedd di-chwaeth o hiwmor, newyddiaduraeth ddifrifol - ar gyfer digwyddiadau cyfoes ac adrodd anghytbwys yng ngwleidyddiaeth y wasg - a zombies, wedi'u haddurno â llawer o gelf, adloniant a roc pync. Mae Draven wedi troi ei hobi yn frand poblogaidd na ellir ei ddosbarthu.








