Onderzoekers hebben samengewerkt in India om een ​​gigantische winkel met teksten en afbeeldingen te bouwen die zijn ontleend aan 73 miljoen tijdschriftartikelen

Onderzoekers hebben samengewerkt in India om een ​​gigantische winkel met teksten en afbeeldingen te bouwen die zijn ontleend aan 73 miljoen tijdschriftartikelen

juli 20, 2019 0 Door admin

 

binspam dupe notthebest offtopic slownewsday oudbakken dom vers grappig inzichtelijk interessant misschien beschrijvend
112523248 verhaal

Science Technology

Onderzoekers hebben samengewerkt in India om een ​​gigantische winkel met teksten en afbeeldingen te bouwen die zijn ontleend aan 73 miljoen tijdschriftartikelen (nature.com)

Geplaatst door msmash uit de goede-gevechten dept.

Een gigantische datastore die stilletjes in India wordt gebouwd

kon grote delen van de wetenschap vrijmaken voor computeranalyse

– maar of het een juridische achtervolging is, blijft onduidelijk. Uit een rapport:

Carl Malamud is op kruistocht om achter slot en gronden achter gesloten informatie te bevrijden – en zijn campagnes hebben vele overwinningen behaald. Hij heeft tientallen jaren lang auteursrechtelijk beschermde juridische documenten uitgegeven, van het opstellen van codes tot gerechtelijke archieven, en stelde vervolgens dat dergelijke teksten het publiekrechtelijke recht vertegenwoordigen dat online beschikbaar zou moeten zijn voor elke burger. Soms heeft hij die argumenten in de rechtbank gewonnen. Nu wendt de 60-jarige Amerikaanse technoloog zijn aandacht op een nieuw doel: het vrijmaken van betaalde wetenschappelijke literatuur. En hij denkt dat hij een legale manier heeft om het te doen. Het afgelopen jaar heeft Malamud – zonder uitgevers te vragen – samengewerkt met Indiase onderzoekers om een ​​gigantische winkel met tekst en afbeeldingen te bouwen die zijn geëxtraheerd uit 73 miljoen tijdschriftartikelen van 1847 tot heden.

De cache, die nog steeds wordt gemaakt, zal worden bewaard op een opslagruimte van 576 terabyte aan de Jawaharlal Nehru University (JNU) in New Delhi. “Dit is niet elk tijdschriftartikel ooit geschreven, maar het is veel,” zegt Malamud. Het is vergelijkbaar met de grootte van de kerncollectie in de Web of Science-database, bijvoorbeeld. Malamud en zijn JNU-medewerker, bioinformaticus Andrew Lynn, noemen hun faciliteit het JNU-gegevensdepot. Niemand mag werk uit de repository lezen of downloaden, omdat dat het auteursrecht van de uitgevers zou schenden. In plaats daarvan, zo stelt Malamud, konden onderzoekers de tekst en gegevens doorzoeken met computersoftware, door de wetenschappelijke literatuur van de wereld bladeren om inzichten op te halen zonder de tekst daadwerkelijk te lezen. Het ongekende project genereert veel opwinding, omdat het voor het eerst enorme delen van de literatuur met betaalde muren kan openen voor eenvoudige, gecomputeriseerde analyse.

Tientallen onderzoeksgroepen hebben al papieren bij elkaar om databases met genen en chemicaliën te bouwen, associaties tussen eiwitten en ziektes in kaart te brengen en bruikbare wetenschappelijke hypotheses te genereren. Maar uitgevers controleren – en beperken vaak – de snelheid en reikwijdte van dergelijke projecten, die zich doorgaans beperken tot abstracts, niet uit volledige tekst. Onderzoekers in India, de Verenigde Staten en het Verenigd Koninkrijk maken nu al plannen om de JNU-winkel te gebruiken. Malamud en Lynn hebben workshops gegeven bij Indiase overheidslaboratoria en universiteiten om het idee uit te leggen. “We brengen hoogleraren binnen en leggen uit wat we doen. Ze raken helemaal opgewonden en zeggen:” Oh god, dit is geweldig “,” zegt Malamud. Maar de juridische status van het depot is nog niet duidelijk. Malamud, die contact opnam met verschillende intellectuele eigendomsadvocaten (IP) voordat hij aan het werk ging in het depot, hoopt een rechtszaak te voorkomen.

8 Catfish = 1 Octo-puss

Working …

Lees Meer