ARRP – Ghid de validare și verificare informații – tratament de bază contra Fake-News
Autor: Ella NICA, vicepreședinte ARRP
Fenomenul Fake-News sună incitant și produce efecte. Pot fi inofensive, puțin păguboase sau generatoare de pierderi uriașe pentru diverși actori din piață. Putem emite legi pentru a le opri. Nu s-ar reuși, în totalitate. Dar, cine verifică veridicitatea informațiilor? Un soft? Poate fi foarte bun, dar ține el cont de toate criteriile de verificare și validare? Este analiza de conținut concludentă? Are nevoie de verificare umană? Este el costisitor pentru utilizatori? Poate, la rândul lui, softul, să fie păcălit și să gireze anumite informații care par autentice din mediul online, dar, rezultatul să fie o eroare?
Pot păcăli super-specialiștii în comunicare aceste soluții software, pentru a furniza în piață informații de tip Fake-news (nici total știri-nici total false, nici total adevărate, dar foarte credibile) utile unor grupuri de interese? Categoric, da! Cine credeți că a dus dezinformarea la nivel de artă generând un adevărat fenomen Fake-News în lupta pentru accesul la piețe tot mai mari și eliminarea competitorilor din diverse piețe de interes (indiferent de domeniul de activitate)?
I. Cauzele de bază ale dezvoltării fenomenului:
Cele mai importante patru cauze ale amplorii fenomenului sunt:
- Existența unor super experți în comunicare, chiar neetici, ce pun interesul clientului înainte de orice, iar pentru ei, scopul scuză mijloacele și folosesc arta manipulării cu talent. Fenomenul s-a dezvoltat pentru că a folosit cuiva care a investit.
- Informația, evident, poate fi furnizată şi diseminată, în online, în special, de oricine, iar acest lucru nu prea se poate schimba, însă putem ști cum ne alegem sursele de informare, cum le validăm. Au apărut soluții software, și ele realizate tot de oameni. Specialiștii care lucrează la realizarea acestor soluții software au pornit, în general, de la verificarea și validarea informațiilor ținând cont de anumite criterii de bază, criterii prezentate în cele două tabele prezentate în Ghidul ”basic” de verificare și validare a informațiilor.
- Deprofesionalizarea mass-media (câteva cause: subfinanțare, salarii neplătite, lipsa învăţării pe tot parcursul vieții, lipsa unor măsuri care să ajute branșa la dezvoltare sustenabilă)/și a comunicatorilor.
- Credem ce convine sistemului nostru valoric, creat în timp, în funcție de ce am consumat, ca informație.
II. Soluția cea mai simplă contra Fake-news: înțelegerea
Nu putem fi toți cunoscători ai artei manipulării și este chiar obositor să facem asta mereu, însă, când contează pentru noi, avem soluții de bază.
Vor exista legi, vor exista soluții software… Pot ele gândi în locul nostru? Categoric, pot ajuta, dar noi trebuie să gândim. Ce facem dacă nu avem o companie care să își permită achiziția unei soluții software? Ce facem dacă avem o astfel de companie, dar la realizarea acesteia au participat/au finanțat chiar competitorii noștri care ne vor cota de piață?
Putem verifica individual, noi singuri, și este cât se poate de simplu, cu condiția să gândim activ.
Evident, dacă vom considera că merită efortul nostru… Ne întrebăm: de ce a apărut informația în spațiul public/de ce în acel moment și nu în altul/este parte a unui plan mai amplu de comunicare strategic (chiar și în sensul neetic al cuvântului)/cui folosește această informație? cine are de pierdut? este utilă pentru mine? pot fi în publicul țintă? etc.
III. Cum alegem/cernem informația bună, validă, reală?
Soluțiile de bază generate, inclusiv, în cadrul primelor două Conferințe ARRP, din 21 martie 2018 și din 27 mai 2019, sunt:
– Educația;
– Gândirea critică;
– Respectarea unui cod etic minimal;
– Utilizarea adecvată a tehnologiei;
– Reprofesionalizarea celor care livrează informația: jurnaliștii și comunicatorii.
Aceste soluții sunt foarte bune, însă necesită timp. Ce putem face acum? Nu există un vaccin pentru dezinformare/manipulare, însă venim cu o soluție practică, imediată și la îndemână.
Este mai ușor să acceptăm informații ”fake” și să le preluăm pentru că suntem oameni și ne lovim de erori de gândire umană. Nu ține de gradul de inteligență, ci de anumite erori de gândire umană, de lipsa unei gândiri critice, de obișnuințe. Se întâmplă oricui.
IV. „Check-list” pentru depistarea dezinformării (fake-news)
Am identificat câteva metode pentru validarea informațiilor din online și din surse tradiționale. Este un „check list” foarte util.
V. Sistem de surse online – Exploatarea surselor online- instrumente pentru verificarea informatiilor
Era informaţională a indus schimbări profunde în modul de exploatare a informațiilor. Pe lângă oportunităţi şi avantaje, comunicarea digitalizată lansează şi provocări precum:
1. Regăsirea datelor:
a. Identificarea resurselor (motoare de căutare, directoare web)
b. Interogarea – metode de interogare complexă a motoarelor de căutare
2. Colectarea datelor
a. Identificarea unor instrumente/servicii online pentru recepționarea unor fluxuri de date create pe diferite criterii de interogare/ filtrare.
b. Filtrarea fluxurilor RSS
c. Utilizarea unor instrumente specifice de colectare a datelor din surse diverse (html scraper, crawler).
d. Identificarea unor metode de normalizarea a datelor pentru procesare uniformă (afișarea într-un format unitar, extragerea datelor într-un format care poate fi utilizat în aplicații de procesare).
3. Procesarea datelor
a. Stabilirea de categorii pe diferite domenii de interes
b. Utilizarea unor aplicații de traducere.
c. Editarea datelor.
d. Stocarea datelor.
e. Utilizarea unor aplicații pentru valorificarea (vizualizare/ interpretare) unui număr mare de date (Ucinet, Gephi, ACH).
4. Diseminarea informațiilor
a. Utilizarea unor platforme colaborative în care conținutul poate fi publicat, completat și distribuit între mai mulți utilizatori
b. Utilizarea unor servicii online de publicare/transmitere de informații (email, cloud storage- Dropbox, Googledrive, One Drive, webtransfer etc.)
5. Feedback
Utilizarea unor mecanisme (care pot fi automate) cu ajutorul cărora beneficiarii informației pot genera un feedback (confirmarea recepționării datelor, confirmarea informațiilor, solicitarea unor date suplimentare)
În fiecare etapă un rol important îl au instrumentele software/ hardware utilizate.
1. Regăsirea datelor:
a. Identificarea resurselor (motoare de căutare, directoare web)
Motoare de căutare:
- Google – www.google.com;
- Google Custom Search
- Yahoo – www.yahoo.com;
- Bing – www.bing.com;
- Exalead – www.exalead.com;
- Ask – www.ask.com;
- Factbites – www.factbites.com;
- Ixquick – www.ixquick.com;
- Searchedu – searchedu.com.
Metamotoare de căutare – interoghează bazele de date ale mai multor motoare de căutare şi coroborează rezultatele după algoritmi proprii:
- Metasearch – www.metasearch.com;
- Excite – http://excite.com;
- iBoogie – www.iboogie.tv;
- Dogpile – www.dogpile.com;
- Twingine – www.twingine.com.
Motoare de căutare speciale – sunt motoare specializate pe anumite medii (bloguri, filme, imagini etc.), respectiv domenii (juridic, literatură, ştiinţă etc.)
Medii
- Technorati – http://technorati.com;
- NewsNow – www.newsnow.co.uk;
- YouTube – www.youtube.com;
- Picsearch – http://www.picsearch.com/.
Domenii
- Google scholar – scholar.google.com;
- Science.gov Alliance – www.science.gov/scigov ;
- WorldWideScience.org – worldwidescience.org.
Motoare de căutare serială (Serial Search Engines) sunt softuri care interoghează mai multe motoare de căutare simple în serie, fără rescrierea interogării:
- TwinGine – twingine.com.
Motoare de clusterizare (Cluster Search Engines) organizează rezultatele în clustere/ nuclee pe tematici interconectate sau având conţinut similar:
- Carrot2 – search.carrot2.org/stable/search;
- WebClust.com – www.webclust.com;
- Yippy (ex- Clusty, ex- Vivisimo) – yippy.com;
- iBoogie – www.iboogie.tv .
Motoare federative de căutare (Federated Search Engines) lansează căutări pe mai multe resurse simultan, deosebit de metamotorul care caută prin indexuri statice:
- Biznar beta – biznar.com/biznar;
- ZACK Gateway – opus.tu-bs.de/zack/index.en.html;
- MetaCrawler – www.zoo.com/Zoo-Site/.
Motoare de căutare în timp real (Real-Time Search Engines)/ în platformele de socializare (SNS Engines) sunt acele aplicaţii care lansează căutări în timp real, pe platformele de socializare.
- Topsy – www.topsy.com;
- 48ers – www.48ers.com;
- Sency – www.sency.com;
- Twitter advanced search – twitter.com/#!/search-advanced.
b. Interogarea – metode de interogare complexă a motoarelor de căutare
Operatori
- AND – permite căutarea a mai mult de un concept sau termen simultan; toţi termenii trebuie să fie prezenţi în document. Orice spaţiu folosit în linia de interogare reprezintă operatorul AND.
- OR – permite căutarea oricăruia dintre termenii introduşi; poate fi folosit „|” (bară verticală) în loc de OR.
- NOT (-) – exclude din căutare rezultatele ce conţin şi un termen/ concept nedorit.
- ( ) – permite gruparea cuvintelor sau a frazelor în cadrul căutărilor complexe în vederea stabilirii ordinii de filtrare a rezultatelor.
Operatori de căutare (interogare)
- Intext (intext:) – returnează acele pagini care au doar în text cuvântul folosit ca şi criteriu de selecţie.
- Allintext (allintext:) – restricţionează rezultatele căutării la pagini conţinând anumite cuvinte în text, dar nu şi în titlu, descrierea legăturii sau URL.
- Intitle (intitle:) – restricţionează rezultatele căutării la documente al căror titlu conţine anumite cuvinte.
- Allintitle (allintitle:) – restricţionează rezultatele căutării la pagini ale căror titluri conţin toate cuvintele specificate.
- Site (site:) – restricţionează rezultatele căutării la un domeniu sau site specificat.
- Inurl (inurl:) – restricţionează rezultatele căutării la site-uri ale căror URL-uri conţin anumite cuvinte.
- Allinurl (allinurl:) – restricţionează rezultatele căutării la site-uri ale căror URL-uri conţin toate cuvintele specificate.
- Filetype/ ext (filetype:/ ext:) – restricţionează rezultatele căutării la documente de un anumit tip.
- Exemplu: Sintaxa cercetare filetype:pdf va returna fişiere PDF conţinând cuvântul cercetare.
- Link (link:) – restricţionează rezultatele căutării la site-uri ce conţin link/hyperlink-uri către o locaţie anume.
- Related (related:) – afişează pagini legate de un anumit site, în general, prin tematică şi conţinut.
2. Colectarea datelor
a. Identificarea unor instrumente/servicii online pentru recepționarea unor fluxuri de date create pe diferite criterii de interogare/ filtrare.
- Yahoo pipe (https://pipes.yahoo.com/pipes/)
- RSS
- IfThisThanThat (https://ifttt.com/)
- Google alerts
- TalkWalker Alerts (http://www.talkwalker.com/)
b. Filtrarea fluxurilor RSS
- Zapier’s RSS feeds
- YahooQueryLanguage YQL
- Google scripts
c. Utilizarea unor instrumente specifice de colectare a datelor din surse diverse (html scraper, crawler).
- Outwithub (http://www.outwit.com/)
- Custom scraper/crawler
- YTvideoDownloader
- NetvideoHunter
d. Identificarea unor metode de normalizarea a datelor pentru procesare uniformă (afișarea într-un format unitar, extragerea datelor într-un format care poate fi utilizat în aplicații de procesare).
- Normalizarea datelor afișate în browser
- RSS feeds – in format XML
- GraphSearch-Facebook interogări complexe
Interogări de tip:
- https://www.facebook.com/search/fb_user_ID/friends
- https://www.facebook.com/search/fb_user_ID/friends/fb_user_ID/friends/intersect
- https://www.facebook.com/search/fb_group_ID/members
- https://www.facebook.com/search/fb_group_ID/members/fb_group_ID/members/intersect
- Outwithub (http://www.outwit.com/)
3. Procesarea datelor
a. Stabilirea de categorii pe diferite domenii de interes
- Yahoo Pipe
- Google alerts
- Google script
- YQL (YahooQueryLanguage)
b. Utilizarea unor aplicații de traducere.
- Google Translate (https://translate.google.ro/)
- 2Linguale (2linguale.com)
- Systran online (http://www.systransoft.com/)
- Babylon Translate (http://translation.babylon.com/)
c. Editarea datelor.
- Editoare de text (MS Word, Open Office, Libre Office)
d. Stocarea datelor.
- Soluții cloud, sisteme hardware de retenție a datelor cu politici complexe de asigurare a fiabilității, redundanței și siguranței datelor
e. Utilizarea unor aplicații pentru valorificarea (vizualizare/ interpretare) unui număr mare de date (Ucinet, Gephi, ACH).
- Ucinet, Gephi, ACH, Social Network Visualizer (SocNetV), Adjacency, EdgeList, GML, Pajek, Facebook Visualization
4. Diseminarea informațiilor
a. Utilizarea unor platforme colaborative în care conținutul poate fi publicat, completat și distribuit între mai mulți utilizatori
b. Utilizarea unor servicii online de publicare/transmitere de informații (email, cloud storage- Dropbox, Googledrive, One Drive, webtransfer etc.)
5. Feedback
Utilizarea unor mecanisme (automate) cu ajutorul cărora beneficiarii informației pot genera un feedback (confirmarea recepționării datelor, confirmarea informațiilor, solicitarea unor date suplimentare)
Note de final:
Acest ghid este utilizabil, inclusiv în realizarea de analize (cu precădere, în domeniul afacerilor) ce au la bază informații din surse deschise.
Instrumentele indicate în prezentul ghid sunt, în proporție de peste 95%, gratuite pentru utilizatori.
Ghidul a fost realizat ca urmare a mai multor ani de activitate, studiu, experiențe (ale autoarei și ale altor specialiști cu expertiză validată în timp).