MAE îşi face Big Brother bazat pe IA. Va monitoriza site-uri de ştiri, blog-uri şi conturi de jurnalişti, celebrităţi şi demnitari
Ministerul Afacerilor Externe vrea să cumpere un sistem IT bazat pe Inteligență Artificială (IA) care să monitorizeze în timp real conținutul online de pe platformele de social media, site-uri de știri, blog-uri, dar și conturile celor mai influenți influenceri – jurnaliști, celebrități și demnitari. Scopul este detectarea, analizarea și combaterea dezinformării și a propagandei.
Ministerul Afacerilor Externe (MAE), condus până de curând de liberalul Bogdan Aurescu, a demarat sâmbătă, 10 iunie, o licitație deschisă pentru achiziția unui sistem IT bazat pe algoritmi avansați de Inteligență Artificială pentru analizarea și verificarea conținutului online pentru a determina originea acestuia, în scopul detectării, analizării, identificării și combaterii dezinformării din mediul online în domeniile de responsabilitate ale MAE.
Contractul, cu o valoare estimată la peste 3,2 milioane de lei (fără TVA), este finanțat cu fonduri UE și ar urma să fie implementat în termen de 4 luni, potrivit datelor din Sistemul Electronic de Achiziții Publice (SEAP).
Contractul include și achiziția serviciilor de instruire aferente pregătirii personalului propriu în folosirea instrumentului IT dezvoltat.
Vor fi colectate 500 GB de date pe lună: Ce conținut online va fi monitorizat în timp real
În caietul de sarcini al licitației se menționează că procesul de colectare a datelor din surse de tip Facebook, Twitter etc. modulele de colectare a datelor trebuie să asigure un volum minim de 500GB date colectate pe lună, fără costuri suplimentare pentru MAE.
Sistemul IT va include, printre altele, un modul de colectare a datelor online, de tip COTS sau open source, pentru monitorizarea în timp real a conținutului online (platformelor de social media, site-uri de știri, blog-uri etc.), cu următoarele capabilități:
- segmentare geografică – posibilitatea de separare a datelor/mențiunilor în funcție de țara de origine;
- detecție rapidă – articolele, mențiunile sau postările trebuie detectate într-un interval de maxim 30 minute;
- monitorizare interacțiuni – în măsura în care sistemele sursa permit acest lucru, sistemul trebuie să fie capabil să colecteze statistici cu privire la interacțiunile utilizatorilor cu conținutul monitorizat: număr de vizualizări, like-uri, distribuiri, etc. (sistemul trebuie să includă posibilitatea de a programa reîmprospătarea datelor la intervale de timp, pentru a putea acoperi întreaga durată de viața a unui articol, sau postare);
- să extragă date publice din platforme sociale, cel puțin: Facebook, Twitter, Instagram, minim postări și comentarii pentru fiecare rețea socială, cu și fără a fi nevoie de autentificare;
- să permită extragerea metadatelor asociate unei pagini web: data, autor, keywords, descriere, titlu; (…)”.
Instrumentul IT va fi o soluție bazată pe un portal web în care reprezentanții desemnați din cadrul MAE vor accesa datele și informațiile necesare.
Sistemul de IA va monitoriza influenceri și site-uri de știri dar și starea emoțională produsă de articole
Iată câteva dintre serviciile pe care viitorul sistem IT bazat pe Inteligență Artificială ar trebui să le furnizeze:
Dashboard customizabil (n.a. interfață grafică de administrare):
- Dashboard configurabil, sub forma de widgets (drag & drop) pentru a putea compara diverse subiecte, influenceri, cuvinte cheie, etc..
- Feed – utilizatorul poate naviga și gestiona toate mențiunile, să le distribuie altor utilizatori ai sistemului, să adauge note sau etichete. De asemenea, poate arhiva/clasifica informația în dosare personale. (…)
Vizualizare date:
- Determinarea automată a asemănărilor semantice dintre textele analizate, extragerea de hyperlinkuri și referințe din articolele online.
- Aceste linkuri vor fi folosite pentru a construi un grafic de relații semantice semnificative, care descoperă modul în care informația se deplasează în diverse medii online, urmărind-o înapoi la originea acesteia (sursa inițială).
Filtrarea datelor
- Sistemul trebuie să permită filtrarea datelor stocate în funcție de subiect/categorie, cuvinte cheie, canal media, nume utilizatori, perioade de timp (azi, ieri, săptămâna/luna trecuta, etc.), sentiment, limbă, țară, etichete, etc.
Analiza stărilor emoționale induse de un articol
- Sistemul va atribui automat tipul stării emoționale induse de un articol (pozitiva, negativa, neutra) cel puțin în limbile română și engleză, și va permite analiza acestora în funcție de canalul media, tendințe, subiecte, etc. (..)
- Totodată, ofertantul va trebui să prezinte dovezi clare de existență la momentul ofertării a modulului de analiză a stării emoționale induse de un articol și pentru minim limbile spaniolă, italiană, rusă, franceză, germană portugheză, maghiară, ce vor putea fi achiziționate de MAE, ulterior finalizării și punerii în producție a instrumentului IT.
Analiză influenceri și profile
Identificarea celor mai activi/ influenți autori, surse de top și comunități online.
Creare a unui profil de influencer:
- Nume utilizator
- Număr de postări per subiect
- Număr de articole clasificate în funcție de starea indusă de un articol (pozitiv, negativ sau neutru) atribuite postărilor
- Număr de urmăritori
Conturile influencerilor de pe diferite platforme vor fi unificate într-un singur profil de influencer (ex. profile de jurnalisti, celebrități, demnitari). Unificarea se va face în baza unor atribuite comune sau a gradului de similaritate al imaginilor de profil.
Listare top 10 influenceri pentru diferite subiecte/categorii.
Cei mai populari autori
- Scopul acestei secțiuni este de oferi utilizatorilor posibilitatea de a identifica cele mai populare profile care menționează cuvintele și frazele cheie monitorizate.
- Un autor influent cu o acoperire socială considerabilă are cu siguranță un public uriaș, cu o expunere masivă în social media și, pur și simplu, ajung la mai mulți oameni care ar putea fi interesanți și merită verificați.
- Secțiunea va include o listă cu cei mai populari 50 autori, în funcție de scorul de influență și acoperirea socială (cu posibilitatea de vizualizare a întregii liste) (…)
Sumar al celor mai importante metrici
Scopul acestei secțiuni este de a oferi utilizatorilor posibilitatea de a vedea un sumar al celor mai importante valori (volumul postărilor în timp, tipul starilor induse, utilizatori, etc.) legate de proiectul/cuvintele cheie monitorizate.
Sumarul va include următoarele metrici:
- Număr mențiuni – numărul total de mențiuni/fire de discuții descoperite în intervalul de timp selectat:
- Mențiuni social media – numărul total de mențiuni/fire de discuții descoperite pe platformele de social media în intervalul de timp selectat
- Mențiuni non-social media – numărul total de mențiuni/fire de discuții descoperite în afara rețelelor de social media (de exemplu forumuri, bloguri, etc.)
- Acoperirea pe rețelele sociale – numărul estimat de persoane care ar fi putut avea contact cu mențiunile respective de pe rețelele sociale care conțin expresia (frazele) monitorizată (e). Acoperirea estimată pe rețelele sociale se bazează pe numărul de autori care vorbesc despre frazele monitorizate în rețelele sociale, numărul de adepți /abonați/prieteni ai acestora
- Acoperirea non-social media – numărul estimat de afișări cu mențiunile relevante (care conțin cuvintele cheie monitorizate)
- Trebuie luate în calcul numărul de domenii care menționează frazele monitorizate și raportul de vizibilitate pentru aceste mențiuni (procentajul expunerii cuvintelor cheie monitorizate pe un anumit domeniu: URL, titlu, conținut, comentarii, etc.)
- Interacțiuni social media – numărul de interacțiuni generate care conțin cuvintele/frazele monitorizate pe platformele de social media.
- Conținut generat de utilizatori – numărul de mențiuni generate de către utilizatorii platformelor social media, forumurilor, blogurilor, etc.
- Aprecieri social media – numărul de aprecieri ale postărilor care includ cuvintele cheie monitorizate.
- Număr de videoclipuri – numărul de mențiuni video descoperite pe rețelele de social media.
- Mențiuni pozitive – numărul de mențiuni ale cuvintelor cheie monitorizate cu sentiment potențial pozitiv (valoare numerică și procent din numărul total)
- Mențiuni negative – numărul de mențiuni ale cuvintelor cheie monitorizate cu sentiment potențial negativ
- Mențiuni neutre
Top profile publice
- Numele profilului | platforma | procent acoperire | influența
- Procent acoperire – ce procent al întregii discuții a fost generată de autorul selectat (utilizator, profil, pagina etc.)
- Influența – numărul estimat de vizualizări generate de autorul selectat care conține frazele monitorizate. Influența se bazează pe numărul de mențiuni, numărul de adepți/abonați/prieteni
- Secțiunea trebuie să includă și link către profilul respectiv.
- Posibilitatea de a șterge din lista de monitorizare autorul (în cazul în care nu este relevant pentru scopul proiectului respectiv), pentru a permite o analiză cât mai precisă.
Cele mai active profile
- Numele profilului | platforma | audiență | mențiuni
- Audiența – numărul de utilizatori la care s-a distribuit postarea care include frazele monitorizate.
- Mențiuni – numărul de mențiuni ale profilului care includ frazele monitorizare
- Secțiunea trebuie să includă și link către profilul respectiv.
- Posibilitatea de a șterge din lista de monitorizare autorul (în cazul în care nu este relevant pentru scopul proiectului respectiv), pentru a permite o analiză cât mai precisă.
Cele mai active site-uri
O lista cu cele mai active site-uri care conțin frazele monitorizare
– Numele site-ului
– Numărul de mențiuni
Se pot afișa primele 10 site-uri, cu posibilitatea de a deschide lista completă.
Cele mai influente site-uri
O listă cu cele mai influente domenii care conțin frazele monitorizate
– Numele domeniului
– Scorul de influență
– Numărul estimat de vizitatori
Metrice
Sistemul trebuie să includă următoarele metrice:
- – Sentiment, sentiment count
- – Scor influencer
- – Volum postări, articole, distribuiri în ultima ora, zi, luna etc.
- – Număr mediu de postări pe minut/ora pentru anumite subiecte/cuvinte cheie
- – Cele mai distribuite hashtag-uri și link-uri
- – Utilizatorii cei mai menționați în postări
- – Raportul postărilor/distribuirilor
- – Creșterea evoluției într-o anumita perioada
- – Viralizare – bazat pe link-uri, distribuiri și comentarii
Termenul limită pentru primirea ofertelor sau a cererilor de participare la această licitație este 17 iulie 2023. În aceeași zi va avea loc și ședința de deschidere a ofertelor.