https://frosthead.com

De Library of Congress stopt met het archiveren van Twitter

Terug in 2010 verwachtte niemand dat de hub van het politieke discours van de Verenigde Staten snel zou verschuiven naar Twitter, de applicatie voor sociale berichten die gebruikers de mogelijkheid bood om berichten van 140 tekens te 'microbloggen' (hoewel dat onlangs is verhoogd tot een luchtige 280 tekens). Destijds begon Twitter de Library of Congress te sturen naar elke openbare tweet die ooit werd verzonden, zelfs teruggaand naar de vroegste dagen van het bestaan ​​in 2006. Na 12 jaar van elke hete take, fastfood-vete, racistische tweet, Russisch bot en raar gemijmer van Twitter star dril, de bibliotheek heeft er genoeg van. Harper Neidig bij The Hill meldt dat het LOC gisteren heeft aangekondigd dat het na 31 december alleen tweets zal verzamelen die het van historisch belang acht.

In een whitepaper over het onderwerp noemt de bibliotheek verschillende redenen voor de wijziging. Ten eerste is het aantal tweets enorm gegroeid sinds zeven jaar geleden een overeenkomst met Twitter werd getekend, waardoor het beheer van de collectie lastig werd. De aard van tweets is ook veranderd. De bibliotheek ontvangt alleen de teksten van de tweets en ontvangt geen bijbehorende afbeeldingen, video's of geanimeerde gifs. In de loop van de tijd, omdat dat een groter deel van de Twitter-cultuur is geworden, heeft de collectie veel inhoud en context verloren.

De bibliotheek citeert ook de recente uitbreiding van de tweet-tekenlimiet als reden voor de verandering, en legt uit dat Twitter verandert en in de toekomst mogelijk nog meer verandert. “De bibliotheek verzamelt over het algemeen niet volledig. Gezien de onbekende richting van sociale media toen het geschenk voor het eerst werd gepland, maakte de bibliotheek een uitzondering voor openbare tweets ”, legt de bibliotheek uit in de krant. "Nu de sociale media zijn opgericht, brengt de bibliotheek haar verzamelpraktijk meer in overeenstemming met haar collectiebeleid."

Momenteel is het 12-jarige archief van Tweets niet openbaar toegankelijk en heeft het LOC geen actueel tijdschema voor wanneer het beschikbaar zou kunnen zijn. Ze zeggen nu dat het zal dienen als een momentopname van de eerste 12 jaar van een opkomende vorm van sociale communicatie, alsof de bibliotheek elke telegraaf heeft gehad die ooit is verzonden tijdens de eerste 12 jaar van die technologie.

De verhuizing was niet helemaal uit de lucht vallen. Andrew McGill van The Atlantic legt uit dat het LOC niet over de juiste middelen of ervaring voor het project beschikte en geen technici hadden die fulltime aan de tweets werkten. De bibliotheek gooide min of meer batches van onbewerkte tweets, 500 miljoen per dag geproduceerd, naar een server om op een later tijdstip te behandelen. "Dit is een waarschuwing als we beginnen met big data - we moeten voorzichtig zijn waarvoor we ons aanmelden", vertelt Michael Zimmer van de Universiteit van Wisconsin-Milwaukee aan McGill. “Toen bibliotheken niet de middelen hadden om boeken te digitaliseren, kon alleen een bedrijf ter grootte van Google het geld en de lichamen erin stoppen. En dat is misschien waar de Library of Congress vastzit. "

In 2010 was het aantal tweets ongeveer een tiende van het huidige verkeer, en de "retweet" -functie was nog nieuw en threads waren niet actief. In de loop van de tijd hebben tweets die zijn ingesloten in threads, foto's en video's en de nieuwe tekenlimiet elke tweet groter gemaakt en het volume van de dagelijkse gegevens verbluffend. Tegen 2013, zo meldt McGill, gaf de bibliotheek al toe dat het moeilijk was en zei dat het uitvoeren van één zoekopdracht in het tweetarchief van 2006 tot 2010 24 uur zou duren op het huidige systeem van het LOC.

In de oorspronkelijke overeenkomst stemde de bibliotheek ermee in de tweets gedurende zes maanden te embargo en verwijderde tweets en privé-tweets te verwijderen. Onderzoekers waren enthousiast over de toegang tot de gegevens, maar zijn teleurgesteld over het gebrek aan openbare toegang. Toch hopen sommigen dat de bibliotheek uiteindelijk een manier zal vinden om de tweets toegankelijk te maken, wat erg waardevol kan zijn voor sociologen, psychologen, politieke wetenschappers en andere onderzoekers.

"Ik ben geen Ph.D., maar het verbaast me om na te denken over wat we kunnen leren over onszelf en de wereld om ons heen met deze rijkdom aan gegevens, " schreef LOC voormalig communicatiedirecteur Matt Raymond toen het partnerschap was bekend gemaakt. "En ik weet zeker dat we dingen zullen leren die niemand van ons nu zelfs maar kan bedenken."

Hoewel we de archieven niet hebben om door te kijken, heeft Twitter ons nog veel dingen geleerd. Gewone mensen kunnen hilarischer zijn dan de beste komieken. Ze kunnen ook akelig dom zijn. Nazi's bestaan ​​nog steeds en hebben geen probleem hun gruwelijke gedachten te uiten. Trollen zullen elk gesprek verpesten, hoe banaal ook. En natuurlijk is beknoptheid de ziel van humor. En geesteloosheid in gelijke mate.

De Library of Congress stopt met het archiveren van Twitter