Digitaliseringsprojektets hjemmeside | DNLB Homepage


Digitalisering af danske naturvidenskabelige plancheværker

Slutrapport, januar 1998


Indhold:


Projektresumé
Indholdsfortegnelsen

Titel
Digitalisering af danske naturvidenskabelige plancheværker
Ansøger
Danmarks Natur- og Lægevidenskabelige Bibliotek
Formål
At gøre de væsentligste danske naturvidenskabelige plancheværker tilgængelige via Internet/WWW.
Målgruppe(r)
Den naturvidenskabeligt, videnskabshistorisk og kunsthistorisk interesserede offentlighed; videnskabshistorikere og kunsthistorikere.
Indhold
Digitalisering i farver af væsentlige danske naturhistoriske plancheværker samt publicering på WWW. Oprettelse af søgbart register over billederne.
Varighed
Projektstart juni 1997. Publicering på nettet af væsentlige datamængder: 6 måneder Derudover løbende udvidelser.

Projektet støttes som Kulturnet Danmark-projekt af Kulturministeriet


Resultater
Indholdsfortegnelsen

Digitaliseringen af Flora Danica er en del af et projekt under Kulturnet Danmark, som gennemføres på Danmarks Natur- og Lægevidenskabelige Bibliotek. Projektet har til hensigt at publicere danske naturhistoriske plancheværker på World Wide Web.

Ved projektstart forsommeren 1997 er digitaliseringen af bogværket Flora Danica påbegyndt. Ved afslutningen af den ministerielt støttede projektperiode pr den 31.12.1997 er følgende nået:

Billeddatabasens struktur

Digitaliseringen og opbygningen af databasen forventes færdiggjort i løbet af sommeren 1998.

Herefter er det tanken løbende at digitalisere andre danske naturhistoriske plancheværker og eventuelt andet billedmateriale i DNLB's besiddelse, såfremt der kan findes ressourcer til det.

Logo: Flora Danicas afbildning af engblommen (planche 133) er valgt som logo for projektet. Det er en af de meget smukke plancher i bogværket, og samtidig en velkendt dansk blomst.

Selv inden projektet er offentliggjort, har der vist sig interesse for publiceringen af Flora Danica-plancherne. Der er kommet positive reaktioner, bl.a. fra Københavns Universitet med en meget grundig og konstruktiv kritik, der lægger op til yderligere samarbejde med universitetet om eventuelle fremtidige udvidelser af databasen.


Projektforløb
Indholdsfortegnelsen

Den praktiske del af projektet påbegyndtes i forsommeren 1997. Indskanningen har ikke helt nået det omfang, vi havde forventet; det skyldes forsinkelser omkring leveringen af udstyret, at det indkøbte udstyr i praktisk brug var langsommere end de første tests havde antydet, og at skanneren måtte til reparation undervejs.

Det nye i projektet har for DNLB dels været etablering af en skanningsfunktion, og dels en ny kombination samt udvidet udnyttelse af i forvejen kendte teknikker. Der er opbygget en vigtig know-how i biblioteket, lige som projektet har medvirket til en forøget opmærksomhed om plancheværkerne som de kunstværker, de også er. Samarbejdet de forskellige personalegrupper/afdelinger imellem har fungeret gnidningsfrit, og de opståede problemer er blevet løst undervejs.

Selv om vi naturligvis ind imellem har måttet ændre trufne beslutninger, har det ikke været nødvendigt at gentage allerede udført arbejde. Dog er der behov for ændring af hjemmesidens tekniske opbygning; et arbejde, hvis resultat ikke vil kunne ses af brugerne.

På de første ca. 300 plancher sidder målestokken inden for billedkanten; dette blev ændret, målestokken, hvis der er muligt, ligger uden for.

Netop for at undgå at gentage allerede udført arbejde, har opbygningen af browsefunktionen været sat i stå. Dette afventer indberetning af nye videnskabelige samt danske navne til databasen. Der er - trods automatiseringsrutiner - stadig meget manuelt arbejde i opbygningen af disse sider.


Om plantenavnene
Indholdsfortegnelsen

Ud over de rent tekniske problemer - valg af udstyr, grafikformat m.v. - har det været nødvendigt at tage stilling til, hvilke navne, som skulle være søgbare i databasen. Når det kan volde problemer, skyldes det, at navngivningen er skiftet flere gange siden udgivelsen af Flora Danica. Det gælder både de latinske og de danske navne.

Den væsentligste nøgle til Flora Danica er: Johan Lange: Nomenclator "Florae Danicae", Hauniae (København) 1887. Heri anfører den sidste af rækken af Flora Danica-redaktører, Johan Lange, planche for planche dels det navn, som anføres i Flora Danica, og dels det navn, som var gældende videnskabeligt navn ved udarbejdelsen af værket i midten af 1880-erne (Nomina emendata). Desuden er der en liste, som er ordnet efter slægtsforhold og en alfabetisk liste. Nomenclator gengiver gældende botanisk navngivning og opfattelse ved midten af 1880-erne. Selv om Nomenclator ofte ikke er i overensstemmelse med den nutidige navngivning og opfattelse, bruges den stadig af fagbotanikere som nøgle til Flora Danica

Følgende fire navne kan søges fra ca. marts 1998:

  1. Navnet som anført i Flora Danica. Kilde til dette navn er Lohan Langes Nomenclator.
  2. Det 'forbedrede' navn (Nomina emendata), fra Johan Langes Nomenclator.
  3. Det nugældende latinske navn. Som kilde til de nugældende latinske navne bruges Tutin, T. G., D. M. Moore, G. Halliday & M. Beadle: Flora Europaea, 1-5, 1964-1980. Hvor redaktørerne af disse navne har været opmærkson på, at der ikke er fuld enighed om navngivningen af en plante, anføres også alternativ-navn(e).
  4. Det eller de nugældende danske navn(e). Som kilde til danske navne er alt overvejende anvendt Mossberg, Bo, Lennart Stenberg & Stefan Ericsson: Den store nordiske flora. Oversat og bearbejdet af Jon Feilberg og Bernt Løjtnant. København 1994. For at gøre databasen til et effektivt søgeværktøj for ikke-botanikere indføres mange populærnavne, også sådanne, som i virkeligheden er fællesbetegnelse for en lang række arter. Der gøres ikke noget forsøg på at indføre samtlige danske navne i databasen. Det skal bemærkes, at nogle mindre kendte planter ikke har et dansk navn.

For de højere planters vedkommende (karplanter) er indberetning til databasen af nugældende videnskabelige navne samt danske navne lagt i hænderne på firmaet Biomedia og udføres af Jon Feilberg og Henry Nielsen. Under udførelsen af arbejdet er det i tvivlstilfælde nødvendigt at konsultere den originale tavle fra Flora Danica for at få en så korrekt bestemmelse af planten som muligt. Selv denne konsultation vil i nogle få tilfælde ikke kunne løse problemet; dette vil blive noteret i databasen.

Der arbejdes stadig på at få etableret mulighed for at opdatere basen med videnskabelige og danske navne for de øvrige planter (svampe, mosser, alger m.v.).


Om det anvendte udstyr og programmel
Indholdsfortegnelsen
Til projektet anvendes følgende udstyr:


Om anvendelsen af programmellet
Indholdsfortegnelsen

Adobe Photoshop
Adobe Potoshop bruges primært til at formindske filerne med og til at konvertere de formindskede filer til JPEG-formatet. Da der er tale om mange filer, drages der nytte af makrofunktionen "Handlinger".
Biblioteksprogrammet ALEPH
DNLB's bibliotekssystem afvikles for tiden under programmet ALEPH. Dette programs WWW-grænseflade er valgt til billeddatabasen. ALEPH's faciliteter udnyttes bedst muligt. Der sker direkte fremvisning af billedfilerne ved søgning i ALEPH samtidig med at oplysningerne om plantenavn, hæfte- og planchenummer m.v. vises frem. Det grafiske udtryk af WWW-siderne kunne have været bedre, men merabejdet hermed ville langt overskygge gevinsten i brugen af billeddatabasen. Da der er tale om en billeddatabase, som med tiden skal rumme andet og mere end billeder af planter, er der valgt generelle beskrivelser af de enkelte felter. Det er vort håb, at denne generalisering ikke forringer brugen af de enkelte værker, som med tiden bliver digitaliseret til basen.

Om billedbehandlingen
Indholdsfortegnelsen
Plancherne i Flora Danica bliver efter indskanningen lagret som .TIF-filer. Disse filer skal dels formindskes og dels konverteres til .JPG-filer inden de bliver lagt ud på WWW-serveren.

Valget af formindskelsesgrad og billedkompression er resultatet af et kompromis mellem hensynene til billedkvalitet og praktisk anvendelighed.

Formindskelse af billederne
De originale filer formindskes til ca 20% af den oprindelige bredde af billedet. Først med en så kraftig formindskelse har billedet en størrelse, som tillader en fornuftig fremvisning på en 1024×768-skærm. Også på en 800×600-skærm vil man kunne se det meste af billedet, hvorimod opløsningen på standard VGA-skærme (640×480) er så lille, at man i de fleste tilfælde kun kan have ca. halvdelen af billedet på skærmen. Når den nye skanner tages i brug, vil de originale filer indeholde flere punkter, hvorfor der skal vælges en anden (større) formindskelse af billedet; sker det ikke, vil billederne på WWW blive for store til at være praktisk anvendelige.
Billedkompression
Billedkompressionen sker ved hjælp af formatet JPEG. Dette format er et af de for tiden mest anvendte, og det giver en betydelig formindskelse af filstørrelsen uden nævneværdig forskel i billedkvalitet. Eksempelvis fylder billedet med engblommen (Trollius europaeus L.) 11.866 kb i TIF-formatet, mens det samme billede fylder 58 kb i JPEG. Det betyder meget for den tid det tager at hente billedet.
Når man gemmer i JPEG, kan man vælge mellem mange kompressionsgrader. Høj kompression giver mindre filer, men også ringere billedkvalitet. Da billedkvaliteten er meget væsentlig for dette projekt, har vi valgt en 'lille' kompression. 'Thumbnails', derimod, komprimeres kraftigt hvorved filerne bliver væsentlige mindre. Det betyder meget når man browser gennem hæfterne, da der skal hentes 20 thumbnails på hver side.
De originale filer
De originale .TIF-filer gemmes ukomprimeret på CD-ROM-plader. Det giver bl.a. mulighed for at fremstille nye og større billeder til fremvisning via WWW, når gennemsnitsskærmen om nogle år har større opløsning end i dag, og transmissionshastighederne er øget. Der kan være mellem 30 og 40 filer på én CD-ROM. Når det er valgt ikke at bruge nogen form for kompression skyldes det dels, at filerne så kan læses direkte fra CD-ROM'erne, og dels, at vi undgår risikoen for datatab.
Præsentationen af billederne
Selv om det er god tone i WWW-verdenen at fortælle filstørrelsen på billeder, der skal nedhentes, og selv om billederne i billeddatabasen typisk har en størrelse på mellem 60 og 90 kB, har vi valgt ikke at give denne oplysning. Det skyldes, at oplysningen for samtlige 3.240 plancher i Flora Danica, plus hvad der kommer til, skulle tilrettes i det øjeblik vi beslutter os for at forbedre billedkvaliteten ved at nykonvertere de originale filer; det vil være så arbejdskrævende, at det i sig selv ville være en alvorlig hindring for en nykonvertering.

Om farverne på skærmen
Indholdsfortegnelsen
For at sikre den bedst mulige farvelighed med plancherne i originalværket, publiceres plancherne med 16 mio. farver. Gengivelsen af de mange farver er i øvrigt ganske afhængig af modtagerens skærm. Er skærmen indstillet til 256 farver, eller er den dårligt indstillet, kan farverne afvige meget fra originalerne.


Projektledelse
Indholdsfortegnelsen
Projektmedarbejdere:
Overassistent Ann-Katrine Christoffersen
Fotograf Bent Grøndahl
Bibliotekskonsulent Torsten Schlichtkrull (projektleder)
Overbibliotekar Mette Stockmarr (ledelsesmæssigt ansvarlig)

Samarbejdspartner:
Biomedia ved Jon Feilberg
Botaniske Centralbibliotek har ydet konsulentbistand


Torsten Schlichtkrull, ts@dnlb.dk
 

© Copyright 1998 Danmarks Natur- og Lægevidenskabelige Bibliotek