Copyright Branko Collin, Amsterdam 2007.

Slimmer zoeken naar elektronische boeken

Gratis boeken op het web

Het zoeken naar elektronische boeken op het World Wide Web wordt gemakkelijker als u zich niet beperkt tot zoekmachines als Google Books.

Branko Collin

Elektronische boeken op het internet behoren gedeeltelijk tot het Deep Web – dat deel van het World Wide Web dat om uiteenlopende redenen niet of slecht door zoekmachines wordt geïndexeerd. Hoeveel gratis elektronische boeken er via het web beschikbaar zijn is lastig te zeggen. De Online Books Page heeft op het moment van schrijven een lijst van links naar meer dan 25.000 gratis boeken op het web, maar dat aantal was al min of meer bereikt voordat Google en The Internet Archive met grootschalige scanprojecten begonnen. Gallica, de elektronische arm van de Franse nationale bibliotheek, claimt alleen al meer dan 90.000 werken aan te bieden. De lijst van de Online Books Page verwijst verder alleen naar Engelstalige boeken in een tekstvariant – dat wil zeggen, een formaat dat niet of niet slechts uit afbeeldingen, maar (ook) uit computerleesbare tekst bestaat.

[foto van een e-reader]
Illustratie: Een dit jaar geïntroduceerde mogelijke e-reader is de opvouwbare Readius van Polymer Vision. Bron foto: Polymer Vision.

Bronnen

Om gratis elektronische boeken op het web te vinden is het wellicht nuttig om u eerst af te vragen waarom mensen en organisaties boeken beschikbaar stellen. Google probeert alle informatie ter wereld te indexeren; het restproduct voor boeken, te weten scans van boeken, kan de Amerikaanse zoekgigant daarbij op zijn beurt beschikbaar stellen. The Internet Archive opereert als een archief; het wil werken ter naslag archiveren. Gallica is onderdeel van een bibliotheek; ook zijn taak is informatie te ontsluiten. Project Gutenberg is een verzameling vrijwilligers die het als haar taak ziet de literatuur van de wereld voor iedereen toegankelijk te maken in elektronische vorm. Er bestaan veel universiteitsprojecten die zo natuurgetrouwe elektronische kopieën van gedrukte boeken willen maken, waarbij het tekstformaat allerlei mark-up bevat die aan moet geven waar pagina's in het gedigitaliseerde werk beginnen en eindigen, welke spreker aan het woord is in een toneelstuk, enzovoort.

[scan van een cover]
Illustratie: De Decamerone is in het Nederlands verkrijgbaar bij Project Gutenberg.

Tenslotte zijn er nog auteurs en andere individuen die eigen werken of de werken van anderen in elektronische vorm aanbieden. De auteur, omdat hij gelezen wil worden; de andere, omdat hij bijvoorbeeld fan is van een lang geleden schrijver en hij iedereen met diens werken kennis wil laten maken.

Ook binnen categoriën van collecties is er onderscheid. Het Oxford Text Archive richt zich niet op bepaalde auteurs, en kan dus al gauw tekort schieten als u alle uitgaven van bijvoorbeeld de Britse grondlegger van de evolutieleer, Charles Darwin zoekt. De website Darwin Online bevat daarentegen alle gepubliceerde werken van de beroemde bioloog, en veel van zijn manuscripten.

Verdere zoekcriteria

Als u dan toch boeken aan het zoeken bent, hanteert u over het algemeen meer criteria dan dat het boek vindbaar moet zijn. Als u het eenmaal hebt gevonden, wilt u ook een exemplaar hebben dat u kunt en mag gebruiken.

In de eerste plaats zult u alleen boeken willen vinden in formaten die u kunt gebruiken. Als u een boek op uw Palm PDA wilt lezen, zult u bijvoorbeeld eerst een programma voor Palm OS moeten kopen of downloaden waarmee u elektronische boeken kunt lezen, en vervolgens boeken in een formaat dat het leesprogramma aankan.

Daarnaast zijn niet alle gratis boeken echt gratis, omdat er restricties zitten op bepaalde vormen van gebruik. Zo zijn er websites die werken aanbieden onder een licentie die bepaalt dat u een boek wel voor eigen gebruik mag downloaden, maar niet mag verdergeven. Voor dat laatste gebruik zou u dan vermoedelijk moeten betalen (dat is niet altijd duidelijk). Als u bijvoorbeeld boeken in een klas of een leesclub wilt gebruiken, zult u dus ook moeten uitzoeken of dat mag.

Een groot deel van de boeken dat wordt aangeboden is onderdeel van het publiek domein; dat deel van de wereld dat geen eigendom is, en dus door iedereen zonder restricties te gebruiken is. Toch zijn er veel verzamelingen van publiek domein-werken die een auteursrecht op de door hen gedigitaliseerde boeken claimen en daarmee een spelletje van juridisch landjepik spelen.

Dat de dreiging van juridische actie geen denkbeeldige hoeft te zijn, blijkt uit het verhaal van het Amerikaanse Blackmask, een van de populairste e-booksites op het web. Nadat bleek dat Blackmask enige boeken online had staan die nog onder het auteursrecht vielen, werd de site door een uitgever aangeklaagd. Daarbij werd de hele site van het web gehaald, niet alleen de werken die er illegaal opstonden.

Blackmask was met name populair, omdat het in tegenstelling tot veel e-booksites zijn boeken in een uiteenlopende formaten aanbood. Gelukkig bestaan er meer verzamelingen van gratis elektronische boeken waarbij de uitbater probeert de elektronische boeken in zo leesbaar mogelijke formaten aan te bieden. Manybooks is een dergelijke website, die alles van Project Gutenberg heeft, aangevuld met een groot aantal boeken die door de auteurs onder een Creative Commons-licentie zijn vrijgegeven.

Boeken die door de auteurs zijn vrijgegeven zijn vaak ook via de website van die schrijvers te vinden, of op sites waar de gedrukte versie te koop is (denk aan Lulu.com). Verder zijn er websites als Wikibooks, waar auteurs gezamenlijk boeken schrijven.

[schermafdruk] [schermafdruk] [schermafdruk]
Illustratie:Drie verschillende PDF's van Onder Moeders Vleugels ("Little Women") via Manybooks.net.

Nederlandstalige boeken

In het artikel Project Gutenberg stip ik al kort aan waar u Nederlandstalige boeken kunt vinden. Zo zijn er naast Project Gutenberg ook het stilliggende Project Laurens Jz Coster en de Digitale Bibliotheek van de Nederlandse Letteren. Dat laatste is een voorbeeld van een project dat auteursrechten claimt op zijn versies van werken in het publieke domein.

De sites van literaire genootschappen of van individuele fans van auteurs kunnen ook boeken of verwijzingen naar boeken bevatten. Jules Verne-fan Garmt de Vries heeft bijvoorbeeld een kleine collectie zeldzame Verne-teksten, en verwijst verder naar Zvi Har’El’s Jules Verne Collection, dat op het moment 96 werken van de vader van science-fiction online heeft staan, waaronder zes in het Nederlands. Daarmee is de laatstgenoemde collectie niet compleet; Project Gutenberg heeft er negen, en is een kleine twintig verdere Verne-boeken aan het voorbereiden.

Het vinden van een Nederlandstalig boek in een internationale (vaak voornamelijk Engelstalige) collectie is op het eerste gezicht niet altijd eenvoudig. Collecties geven vaak niet aan welke boeken in het Nederlands zijn, en dat is ook niet per se vreemd; hoe weet een Amerikaan wat Nederlands is? Gelukkig beschikken collecties als Gallica en die van The Internet Archive over een zoekfunctie, waar u door Nederlandse woorden in te voeren toch heel wat kunt vinden. Volgens de vereniging voor taalliefhebbers Onze Taal komen de woorden de, van, het, een, in, en, dat, zijn, met, is, die, op, niet, te, voor, maar, hij, als, er en ook in het geschreven Nederlands het meest voor. Niet al deze woorden zijn geschikt om mee te zoeken: en is bijvoorbeeld ook een Frans woord, en zal dus ook Franse boeken in de zoekresultaten opleveren.

Welk boek zoek ik?

Het vinden van boeken is lastig als u de auteur of titel niet kent. Hetzelfde probleem kan ook worden veroorzaakt door het door elkaar gebruiken van verschillende titels voor hetzelfde werk, of verschillende namen voor eenzelfde auteur. Om bij het voorbeeld van Jules Verne te blijven; zijn werken zijn in het Nederlands door verschillende uitgevers uitgebracht, die titels vaak op hun eigen manier vertaalden. Zo is volgens de site van Garmt de Vries het bekende "De reis om de wereld in 80 dagen" ook uitgebracht als "Een reis om de wereld in 80 dagen", "Rondom de wereld in 80 dagen" en "De avontuurlijke reis om de aarde". Als u dan alleen op de eerste titel zoekt en het werk niet online kunt vinden, kan het ook nog onder een van de andere namen beschikbaar zijn.

Als u de titel of auteur van een werk niet meer weet, kan het nuttig zijn een zoekmachine als Google te gebruiken. Stel dat u de naam van een personage nog weet; zoekend op "doctor Ferguson" levert bij de tweede link al een verwijzing naar Jules Verne op. Als u niet zeker meer weet of een boek met een bepaalde titel is wat u zoekt, kunt u de Search Inside-functie van Amazon gebruiken om dat te verifiëren. Dit kan nuttig zijn als u alleen maar de moderne tekst van een klassieker kent.

[portretfoto] [portretfoto] [portretfoto]
Illustratie: Vanwege de aard en de lange duur van het auteursrecht zijn met name boeken gratis verkrijgbaar van witte mannen met baarden (v.l.n.r. Jules Verne, Charles Darwin en Charlie Stross).

Zoekmachines van zowel Google als online winkels kunnen ook gebruikt worden om op licentie te zoeken. Zo heeft Lulu een functie om te zoeken naar boeken die vrij verspreid mogen worden. Dat is nog geen garantie dat er een gratis downloadbare variant bestaat, maar het wijst wel in die richting. Ook Google heeft de mogelijkheid om in zijn Advanced Search te zoeken op werken in een bepaald formaat (bijvoorbeeld PDF) die vrij te gebruiken en te delen zijn.

Ook sommige uitgevers hosten gratis e-books van hun auteurs. De science-fiction-uitgever Baen is hiervan een goed voorbeeld. De auteurs van Baen stellen vrijwillig deze boeken beschikbaar, omdat de praktijk uitwijst dat dit de verkoop van nieuwe zowel als de oude, gratis beschikbare werken verhoogt. Blijkbaar is het goed als de lezers van Baen makkelijker in staat zijn met het werk van een schrijver in aanraking te komen.

Sinds Google begon met het grootscheeps digitaliseren van gedrukte boeken is de interesse van musea, archieven en bibliotheken in een digitale collectie sterk toegenomen. Veel van deze organisaties zijn dan ook begonnen met scanprojecten. Niet al deze werken worden ter download aangeboden.

Slim zoeken

Wie in het Deep Web wil zoeken, doet er goed aan niet alleen op Google te vertrouwen. Gespecialiseerde sites beschikken over tienduizenden elektronische boeken die gratis te downloaden zijn. Een zoekmachine als Google kan behulpzaam zijn bij klusjes als het uitvinden welke tekst bij welk boek hoort en om de sites te vinden waar u ontdekt welke boeken er te downloaden zijn.


Disclaimer: Branko Collin is een vrijwilliger van Project Gutenberg.


Collecties
Links naar (boeken in) collecties
The Online Books Page onlinebooks.library.upenn.edu Links naar vrij verspreidbare Engelstalige boeken in een computerleesbaar formaat als platte tekst, HTML en PDF.
Scaninitiatieven
Google Books Search books.google.com
Microsoft Live Search Books search.live.com Lijkt te verwijzen naar The Internet Archive, heeft daarmee een bredere collectie dan Google.
The Internet Archive www.archive.org/details/texts Zowel gescande boeken uit Amerikaanse en Canadese universiteitsbibliotheken als door vrijwilligers geüploade boeken.
Wetenschappelijke corpora (enkelvoud: corpus)
The Oxford Text Archive ota.ahds.ac.uk Een van de oudste publiek toegankelijke corpora van elektronische teksten.
Electronic Text Center etext.lib.virginia.edu Brede Amerikaanse collectie.
Archieven
Early Canadiana Online www.canadiana.org Canadese boeken.
Gallica gallica.bnf.fr Franse boeken en boeken over Frankrijk.
Nederlandstalig
Project Gutenberg www.gutenberg.org Door vrijwilligers ingescande en gecorrigeerde werken. Formaten: minimaal "platte tekst" en Plucker, maar vaak ook HTML, en waar nodig PDF.
Project Laurens Jansz. Coster cf.hum.uva.nl/dsp/ljc/ Het eerste volledig Nederlandstalige "Project Gutenberg".
Digitale bibliotheek voor de Nederlandse letteren www.dbnl.org Grote verzameling Nederlandse boeken, ook moderne werken.
Overige collecties
Wikibooks www.wikibooks.org Door vrijwilligers geschreven schoolboeken.
Darwin Online darwin-online.org.uk De complete werken van Charles Darwin.
Zvi Har’El’s Jules Verne Collection jv.gilead.org.il Grote Jules Verne-verzameling in allerlei talen.
Baen www.baen.com In de Baen Free Library vindt u downloads van met name de oudere werken in moderne series science-fiction-boeken.
Verzamelsites
Manybooks manybooks.net Een privéinitiatief van Matthew McClintock. Downloadformaten: PDF (instelbare vormgeving), eReader, Mobipocket, DOC, Plucker, iSilo, zTxt, Rocketbook, RTF, TCR, HTML (instelbare vormgeving).
Open Library www.openlibrary.org Een online boekleesinterface van The Internet Archive. Downloadformaten: DJVU, PDF.
Voorgelezen boeken (audiobooks)
Librivox librivox.org Door vrijwilligers voorgelezen.
Literal systems literalsystems.org Door sponsors betaald.
AudioBooksForFree.com www.audiobooksforfree.com Grotendeels commerciële site die boeken uit het publiek domein voorleest. De opnames in de laagste geluidskwaliteit zijn na aanmelding gratis te downloaden.
BMW Audio Books www.bmw-audiobooks.com Voor de vervolmaking van dat ritje in uw BMW-cabrio.
Zoekhulp
Search Engine Watch searchenginewatch.com Tips voor het gebruik van zoekmachines.

De bovenstaande lijst met bronnen is uiteraard verre van compleet, maar verschaft al uren van zoekplezier. Om verdere collecties te vinden, kan het handig zijn de Links-pagina's van de genoemde websites te doorzoeken.

Meer eenvoudige artikelen over het gebruik van uw pc treft u aan op mijn homepage.

Dit artikel is in 2007 vermoedelijk verschenen in het computerblad PC Active (de uitgever heeft niet de moeite genomen me een presentexemplaar te sturen), en is ook geplaatst in het april-nummer van het blad NetOpus in 2007. Zie ook het artikel Free ebooks for your Palm op deze site.