Tilbage/Back | Flora Danica Online Homepage | Søg Flora Danica i Cosmos | DNLB Homepage


Flora Danica Online

Teknisk beskrivelse/dokumentation af projektet


Indholdsfortegnelse




Indledning

Digitaliseringen af Flora Danica er en del af et projekt under Kulturnet Danmark, som gennemføres på Danmarks Natur- og Lægevidenskabelige Bibliotek. Projektet har til hensigt at publicere danske naturhistoriske plancheværker på World Wide Web. Projektet støttes af Kulturministeriet.

Når digitaliseringen af Flora Danica er afsluttet, vil samtlige plancher være tilgængelige på WWW. Det vil være muligt at søge hver enkelt plante, ligesom det vil være muligt at browse sig gennem plancherne hæfte for hæfte.


Projektets struktur

Indholdsfortegnelsen

Projekt er udformet, således at der er stor fleksibilitet ved benyttelsen.

Der er to indgange for billeddatabasens brugere:

  1. Søgefunktion via Cosmos: Vælg billeddatabasen
  2. Browsefunktion. Man kan starte med Billeddatabasens hjemmeside og derfra fx vælge at blade sig gennem billederne.

Man kan hele tiden skifte mellem søgning og bladning.

Filernes placering
i mapper/direktorier er
- indtil videre - denne
Billedarkiv
   > FloraDanica
Flora Danica Elektronisk udgave
   > Hefte1 ...
En mappe for hvert af de 54 hæfter
   > THN
Thumbnails
   > WWW
De 'rigtige' billeder
   > HTML
HTML tekstfilerne
Fremtidig Træstruktur
Billedarkiv
   > Flora Danica
Flora Danica Elektronisk udgave
   > HTML
HTML tekstfilerne
   > PICS
   > THN
Thumbnails
   > WWW
De 'rigtige' billeder
   > Andet værk
   > HTML
   > PICS
   > THN
Thumbnails
   > WWW
De 'rigtige' billeder

Hardware og software i projektet

Indholdsfortegnelsen

Indskanningen foregår med et 4×5 tommer kamera med et digitalt bagstykke. Det digitale bagstykke er i forbindelse med en pc, som er forsynet med en cd-rom-brænder. Brug af flat-bed skanner kan naturligvis ikke komme på tale ved indskanning af gamle bøger fra 1700-tallet.


Indskanningen

Indholdsfortegnelsen

Indskaningen sker direkte fra det originale bogværk. For at beskytte farveplancherne mod unødvendig belysning er der kun lys på billederne under selve indskanningsprocessen. Indskaningen af en planche tager alt inklusive (vending af blad, afmontering af bagstykke, skarpstilling, montering af bagstykke, præskanning, afmaskning af billedet, farvejustering, endelig skanning) ca. 10 minutter. Med det nye udstyr forventes arbejdstiden pr. billede reduceret væsentligt samtidig med at kvaliteten af det indskannede billede (der i forvejen er høj) forbedres betydeligt.


De originale billeder
De originale billeder er af meget forskellig størrelse, spændende fra ca. 5×5 cm til ca. 25×45 cm.

Ved valg af indskanning stod flere modstridende hensyn over for hinanden:

Skulle forholdet mellem de originale billedstørrelser bevares?
Det ville give brugeren det 'sandeste' indtryk af originalens mangfoldighed, og altså være mest tro mod originalen.
Det ville give den hurtigste arbejdsgang ved indskanningen; kameraet skulle nemlig have én fast indstilling.
Skulle billedfladen udnyttes fuldt ud?
Udfyldelse af hele billedfladen giver ubetinget den bedste billedkvalitet.
For at opnå dette, er det nødvendigt at foretage en arbejdskrævende indstilling af kameraet til hvert enkelt billede.

Løsningen blev et kompromis. Den elektroniske udgave af Flora Danica betragtes som en selvstændig udgivelse, som ikke behøver at gevgive alle akpekter af den trykte udgave fuldt ud. Der valgtes tre standardindstillinger af kameraet.


Billedbehandlingen

Indholdsfortegnelsen

Billedbehandlingen sker i Adobe Photoshop, version 4.0, dansk version.

De store filer fra skanneren (filstørrelsen ligger typisk mellem 12 og 22 MB, formentlig mere med den nye skanner) kan med dagens teknik ikke publiceres på Internet.

Billedfilerne bliver formindsket på to måder:

  1. Selve billedstørrelsen (bredde og højde) formindskes til 20% af den oprindelige størrelse. Denne kraftige formindskelse er nødvendig for at man kan se hele eller næsten hele billedet med en skærmopløsning på på 800×600 punkter eller højere. Når den nye skanner er taget i brug, vil taller 20% skulle justeres for at opnå et slutresultat på størrelse med det hidtidige.
  2. Dernæst bliver billedet konverteret til JPEG-formatet. JPEG tillader brugeren at vælge kompressionsgrad; af hensyn til billedkvaliteten er der valgt en ret lav kompression (kvalitet 8 på en skala fra 0-10)

'Thumbnails' fremstilles sådan:

  1. Billederne har en fast bredde: 96 pixels. Højden varierer. Denne størrelse giver et billede, som lige netop er stort nok til, at man kan få en fornemmelse af planten.
  2. Kompressionen i JPEG-formatet er ret stor (kvalietet 2 på en skala fra 0 til 10). Der er et mærkbart fald i billedkvalitet, men til thumbnails er det naturligt at vægte filstørrelse højere end billedkvalitet. Der skal hentes 20 thumbnails for hver 'browseside'.

Til reduktion af billedstørrelse og konvertering til JPEG bruges makro-funktionen 'Handlinger' i Adobe Photoshop. Denne funktion tillader behandling af hele mapper/direktorier. Det tager ca. 10 minutter at fremstille billedfiler og thumbnails fra et helt hæfte (60 .TIF-filer, hver typisk mellem 12 og 22 MB store)
For at sikre den bedst mulige farvelighed med plancherne i originalværket, publiceres plancherne med 16 mio. farver. Gengivelsen af de mange farver er ganske afhængig af modtagerens skærm. Er skærmen indstillet til 256 farver eller er den dårligt indstillet kan farverne afvige meget fra originalerne.

De originale filer
De originale TIF-filer gemmes ukomprimeret på cd-rom-plader. Der kan være mellem 30 og 40 filer på én cd-rom. Når det er valgt ikke at bruge nogen form for kompression skyldes det dels, at filerne så kan læses direkte fra CD-ROM'erne, og dels at risikoen for datatab minimeres.
Lagringen på cd-rom giver bl.a. mulighed for at fremstille nye og større billeder til fremvisning via WWW, når gennemsnitsskærmen om nogle år har større opløsning end i dag.
En eventuel nykonvertering vil kunne ske på samme måde som den første konvertering sker, nemlig ved hjælp af Adobe Photoshops makrofunktion 'Handlinger'. Det skønnes, at en nykonvertering vil kunne ske i løbet af få dage.

Søgefunktionen

Indholdsfortegnelsen

Tillempning af Cosmos-WWW søgeskærmene

Indholdsfortegnelsen

Det er vigtigt, at brugeren hele tiden kan skifte mellem søgefunktion og browsefunktion. Derfor er alle Cosmos-WWW' søgeskærme blevet forsynet med en ekstra knap som linker til billeddatabasens hjemmeside. Knapperne i Cosmos-WWW har en generel funktion for hvert globalt bibliotek, og der er ingen mulighed for at tilrette henvisningsmålet i forhold til den logiske base, brugeren har valgt. Derfor vil der i første omgang blive linket til oversigtssiden over Flora Danica-hæfterne, senere vil der blive linket til en side, hvor man vælger den 'database', man ønsker at browse.

Derudover er der ikke forskel på almindelig Cosmos-WWW-søgebillederne og billeddatabasens billeder. Hjælpe- og informationsteksterne er naturligvis blevet rettet.


Opbygningen af databasen

Indholdsfortegnelsen

Billeddatabasen bygges op i DNLB's bibliotekssystem, Cosmos. Cosmos afvikles under biblioteksprogrammet ALEPH.

Billeddatabasen ligger i et eget globalt bibliotek (en selvstændig fysisk base) i tilknytning til bibliotekskatalogerne. At billeddatabasen ligger i sit eget globale bibliotek giver adskillige fordele:

Det er til gengæld ikke muligt at søge i både billeddatabasen og biblioteksdatabasen på én gang. Det kan dog næppe betegnes som en ulempe.

ALEPH's mulighed for at fremstille en 'master'-post, som blot skal udfyldes med det, som er specielt for den enkelte billedpost udnyttes naturligvis; det øger katalogiseringshastigheden væsentligt.

Indtil videre er det tanken, at lade hvert indskanent værk få sin egen logiske database. Dette er dog stadig genstand for overvejelser på DNLB.


Formatet

Indholdsfortegnelsen

Der er valgt en tillempning af MARC-formatet til billeddatabasen:

Formatet er under justering i forbindelse med indberetning af moderne latinske og danske navne til databasen.

Felt Delfelt Beskrivelse
Sysno   Systemnummer. Tildeles af systemet
Base   Basenummer i DNLB's billeddatabase
Flora Danica: 70
00800   Sprogfelt med delfeltkode $$l
Flora Danica: $$llat
00900   Felt/delfelt med kode for digitale værker. Altid $$at
24510
$$a
$$p
Titelfelt
Navnet i Flora Danica
Johan Langes navn fra Nomenclatura ... Indtastes ikke, hvis identisk med $$a
26000  $$c Årstal
30000  $$c Størrelse på billede
44010 
$$a
==$$v
Seriefelt
Flora Danica: Flora Danica
Flora Danica: Hft. nr., Tab. nr.
Det dobbelte lighedstegn bevirker, at hæfte- og tavlenummer ikke trækkes til sætningsregister.
85600  $$u URL-felt. URL på det enkelte billede
EXT 
$$p
$$c, $$x
$$n
Henvisningsfelt i ALEPH-systemet
HTM
URL fordeles på $$c og $$x. Dette kræves af ALEPH
Felt til overskrivning af den tekst, systemet leverer. DNLB har valgt at lade dette felt udfylde med et standard HTML-kald af det billede, som hører til posten (<IMG SRC="...">)
CORR    Administrativt felt
OPEN   Administrativt felt
INIT   Administrativt felt

Effekten af brugen af dette format er


Senere ændringer af formatet

Indholdsfortegnelsen

Formatet vil undergå forandringer efterhånden som billeddatabasen bliver udvidet. Det nuværende format er skabt for at tilfredsstille behovene ved oprettelsen af botaniske og zoologiske billeddatabaser og er muligvis utilstrækkeligt til andre formål. Det vil dog næppe give store problemer at udvide formatet.


Tilføjelse af nye oplysninger i posterne

Indholdsfortegnelsen

Der er truffet aftale med firmaet Biomedia om supplering af Flora Danica-basen med danske og nugældende latinske plantenavne; arbejdet udføres af Jon Feilberg og Henry Nielsen. Disse oplysninger tilføjes ved masserettelser af poster.

Databasen leveres fra Biomedia som en regnearksfil. Konverteringen til Cosmos-format sker via WordPerfect 6.1:

  1. Regnearksfilen gemmes som tekstfil. Felterne afskilles med en <TAB>
  2. Tekstfilen indlæses i WordPerfect, hvor den ved hjælp af to søg-og-erstat kommandoer ændres til en datafil for brevfletning
    1. <TNL> ændres til <ENDRECORD><TNS>
    2. <TAB> ændres til <ENDFIELD><TNL>
    3. Herefter oprettes filen som datafil
  3. Der konstrueren en formatfil, som indeholder feltnavne og faste tekster (fx det meste af URL)
  4. Fletningen foretages, hvorefter filen gemmes som tekstfil og er klar til batch opdatering af Cosmos.

Tilsvarende metode vil kunne bruges ved eventuelle senere masse opdateringer af databasen.


Browsefunktionen

Indholdsfortegnelsen

Browsefunktionen giver mulighed for at blade gennem plancherne i samme orden som de er i originalværket. Det er tanken at bygge en browsefunktion til alle billeddatabasens delbaser, hvor det findes rimeligt. Browsefunktionen er afhængig af forlægget og vil derfor sandsynligvis blive forskellig fra værk til værk.

Browsefunktionen giver mulighed for hurtigt skift til søgefunktion. Når man vælger søgefunktion, bliver man ledt direkte til søgning i den relevante delbase af DNLB's billeddatabase. Som nævnt kan det ikke lade sig gøre at henvise fra søgefunktionen direkte til en del af billeddatabasen.


Browsefunktionens opbygning

Indholdsfortegnelsen

Her beskrives browsefunktionen for Flora Danica med ilhørende beskrivende tekster.

Bogværket Flora Danica består af i alt 54 hæfter (hft. 1-51 + suppl. 1-3), hver indeholdende 60 plancher. I de fleste tilfælde er kun én plante afbildet på en planche; især hen mod slutningen af værket er der dog mange plancher, hvor der er afbildet to eller flere planter på en planche.

  1. Hjemmesiden for Flora Danica indeholder disse elementer:
  2. Fra hjemmesiden kan man vælge en side med en oversigt over samtlige hæfter. Siden indeholder disse elementer:
  3. Når man vælger et hæfte, får man en ny oversigtsside, med en oversigt over 20 plancher. Hvert hæfte deles i i tre dele, fordi nedhentning af 60 thumbnails (à ca 5 kB) vii være alt for tidskrævende. De enkelte hæftesider indeholder disse elementer:
  4. Siderne med thumbnails, 162 i alt. Siderne indeholder disse elementer:

Fremstilling af siderne med thumbnails

Indholdsfortegnelsen

Siderne med thumbnails er fremstillet således:

  1. Der er fremstillet en masterside med top og bund for siderne; mastersiden tilrettes efter behov.
  2. Til brug for fremvisning af thumbnails foretages der et udtræk fra Cosmos i et særligt indrettet format, som indeholder
  3. Denne fil passerer en makro i WordPerfect 6.1, som ved hjælp af en række søg-og-erstat operationer fremstiller 60 skemarækker i HTML. Eksempel på før og efter makro.
  4. En trediedel af denne HTML-fil sættes ind i den tilrettede masterfil, og hver anden rækkekommando fjernes, så siden kommer til at fremstå i to spalter.
    Fremstilling af tre thumbnail-filer (et hæfte) kan alt inklusive ske på under 20 minutter.

Torsten Schlichtkrull, ts@dnlb.dk
 

© Copyright 1998 Danmarks Natur- og Lægevidenskabelige Bibliotek