Tilbage/Back | Flora Danica Online
Homepage | Søg
Flora Danica i Cosmos | DNLB Homepage
Flora Danica Online
Teknisk beskrivelse/dokumentation af projektet
Indholdsfortegnelse
Indledning
Digitaliseringen af Flora Danica er en del af et projekt under Kulturnet Danmark, som gennemføres på Danmarks Natur-
og Lægevidenskabelige Bibliotek. Projektet har til hensigt at publicere danske
naturhistoriske plancheværker på World Wide Web. Projektet støttes af Kulturministeriet.
Når digitaliseringen af Flora Danica er afsluttet, vil samtlige plancher være
tilgængelige på WWW. Det vil være muligt at søge hver enkelt plante, ligesom det vil
være muligt at browse sig gennem plancherne hæfte for hæfte.
Projektets struktur
Indholdsfortegnelsen
Projekt er udformet, således at der er stor fleksibilitet ved benyttelsen.
Der er to indgange for billeddatabasens brugere:
- Søgefunktion via Cosmos: Vælg billeddatabasen
- Vælger man denne mulighed, bliver man præsenteret for Cosmos-WWW's brugergrænseflade.
Brugergrænsefladen er justeret for at forbedre mulighederne for søgning i en
billeddatabase, fx er der tilføjet en ekstra knap, som skifter til browsefunktionen.
- Der søges i DNLB's billeddatabase, der ligger som en selvstændig fysisk base (et
globalt bibliotek) under Cosmos. Billeddatabsen vil med tiden komme til at rumme
adskillige logiske baser, hver modsvarende ét værk eller én samling/sammenhængende
enhed, man kan ønske at søge separat.
- Browsefunktion. Man kan starte med Billeddatabasens hjemmeside og derfra fx vælge at
blade sig gennem billederne.
- Man kan browse sig gennem billederne i samme orden, som de findes i det trykte forlæg.
Browsefunktionen er opbygget i almindelige HTML-sider med små billeder, 'thumbnails' af
hver enkelet planche. Tekstinformationen til planche er fremkommet ved at et udtræk af
billeddatabasen, som er viderebearbejdet, se nedenfor.
Man kan hele tiden skifte mellem søgning og bladning.
Filernes placering
i mapper/direktorier er
- indtil videre - denne |
Billedarkiv |
> |
FloraDanica
Flora Danica Elektronisk udgave |
|
> |
Hefte1 ...
En mappe for hvert af de 54 hæfter |
|
|
> |
THN
Thumbnails |
|
|
> |
WWW
De 'rigtige' billeder |
> |
HTML
HTML tekstfilerne |
Fremtidig Træstruktur |
Billedarkiv |
> |
Flora Danica
Flora Danica Elektronisk udgave |
|
> |
HTML
HTML tekstfilerne |
|
> |
PICS |
|
|
> |
THN
Thumbnails |
|
|
> |
WWW
De 'rigtige' billeder |
> |
Andet værk |
|
> |
HTML |
|
> |
PICS |
|
|
> |
THN
Thumbnails |
|
|
> |
WWW
De 'rigtige' billeder |
Hardware og software i projektet
Indholdsfortegnelsen
Indskanningen foregår med et 4×5 tommer kamera med et digitalt bagstykke. Det
digitale bagstykke er i forbindelse med en pc, som er forsynet med en cd-rom-brænder.
Brug af flat-bed skanner kan naturligvis ikke komme på tale ved indskanning af gamle
bøger fra 1700-tallet.
- Et 4×5" kamera med digitalt bagstykke
- Kort før årsskiftet er kameraet skiftet ud med et Fuji Gx680II 6×8 cm
spejlreflexkamera.
- Et digitalt bagstykke, PhaseOne Studio Kit med tilhørende programmel. Kapaciteten er op
til 2.500×3.571 (8,9 millioner) punkter (pixels) pr. farve. Til sammenligning kan en
almindelig VGA skærm med 640×480 punkter vise 307.200 punkter. Bagstykket kan levere
filer på op til 25 Mb.
- Kort før årsskiftet er denne skanner udskiftet med den større skanner, PhaseOne
Powerphase, som har disse specifikationer: Kapacitet op til 7.000×7.000 punkter pr.
farve. Filstørrelse op til 140 MB. En pentium PC, 200 Mhz, 96 Mb RAM, 3 Gb harddisk.
- Belysning med tempereaturen 5.000° Kelvin, svarende til dagslys.
- Det er vigtigt, at belysningen er konstant og har den rigtige temperatur (farve), da det
ellers ikke kan sikres, at de indskannede billeder har den rigtige farvesammensætning.
- Armaturerne udstråler stort set ingen varme. Selv efter at et emne har været belyst
direkte i lang tid, bliver det ikke mere end håndvarmt; alligevel er det naturligvis
vigtigt at beskytte emnerne ved ikke at udsætte dem for lys i længere tid end højst
nødvendigt.
- En pentium pc, 200 Mhz, 96 Mb RAM, 3 Gb harddisk
- En veludstyret pc er nødvendig til behandling af de meget store filer. I anden
sammenhæng har der været lejlighed til at konstatere, at det på en pentium pc, 100 Mhz,
8 Mb RAM nemt kan tage et kvarter at dreje en grafikfil på 12 Mb 90°
- En CD-ROM brænder med tilhørende programmel.
- cd-rom brænderen bruges til lagring af de oprindelige TIF-filer, se nedenfor.
- Adobe Photoshop.
- ALEPH, som er det programmel, DNLB's bibliotekssystem, Cosmos, afvikles under.
- Herudover anvendes standard programmel, fx til at skrive denne tekst i.
Indskanningen
Indholdsfortegnelsen
Indskaningen sker direkte fra det originale bogværk. For at beskytte farveplancherne
mod unødvendig belysning er der kun lys på billederne under selve indskanningsprocessen.
Indskaningen af en planche tager alt inklusive (vending af blad, afmontering af bagstykke,
skarpstilling, montering af bagstykke, præskanning, afmaskning af billedet,
farvejustering, endelig skanning) ca. 10 minutter. Med det nye udstyr forventes
arbejdstiden pr. billede reduceret væsentligt samtidig med at kvaliteten af det
indskannede billede (der i forvejen er høj) forbedres betydeligt.
De originale billeder
De originale billeder er af meget forskellig størrelse, spændende fra ca. 5×5 cm til
ca. 25×45 cm.
Ved valg af indskanning stod flere modstridende hensyn over for hinanden:
- Skulle forholdet mellem de originale billedstørrelser bevares?
- Det ville give brugeren det 'sandeste' indtryk af originalens mangfoldighed, og altså
være mest tro mod originalen.
Det ville give den hurtigste arbejdsgang ved indskanningen; kameraet skulle nemlig
have én fast indstilling.
- Skulle billedfladen udnyttes fuldt ud?
- Udfyldelse af hele billedfladen giver ubetinget den bedste billedkvalitet.
For at opnå dette, er det nødvendigt at foretage en arbejdskrævende indstilling af
kameraet til hvert enkelt billede.
Løsningen blev et kompromis. Den elektroniske udgave af Flora Danica betragtes som en
selvstændig udgivelse, som ikke behøver at gevgive alle akpekter af den trykte
udgave fuldt ud. Der valgtes tre standardindstillinger af kameraet.
Indholdsfortegnelsen
Billedbehandlingen sker i Adobe Photoshop, version 4.0, dansk version.
De store filer fra skanneren (filstørrelsen ligger typisk mellem 12 og 22 MB,
formentlig mere med den nye skanner) kan med dagens teknik ikke publiceres på Internet.
Billedfilerne bliver formindsket på to måder:
- Selve billedstørrelsen (bredde og højde) formindskes til 20% af den oprindelige
størrelse. Denne kraftige formindskelse er nødvendig for at man kan se hele eller
næsten hele billedet med en skærmopløsning på på 800×600 punkter eller højere. Når
den nye skanner er taget i brug, vil taller 20% skulle justeres for at opnå et
slutresultat på størrelse med det hidtidige.
- Dernæst bliver billedet konverteret til JPEG-formatet. JPEG tillader brugeren at vælge
kompressionsgrad; af hensyn til billedkvaliteten er der valgt en ret lav kompression
(kvalitet 8 på en skala fra 0-10)
'Thumbnails' fremstilles sådan:
- Billederne har en fast bredde: 96 pixels. Højden varierer. Denne størrelse giver
et billede, som lige netop er stort nok til, at man kan få en fornemmelse af planten.
- Kompressionen i JPEG-formatet er ret stor (kvalietet 2 på en skala fra 0 til 10). Der
er et mærkbart fald i billedkvalitet, men til thumbnails er det naturligt at vægte
filstørrelse højere end billedkvalitet. Der skal hentes 20 thumbnails for hver
'browseside'.
Til reduktion af billedstørrelse og konvertering til JPEG bruges makro-funktionen
'Handlinger' i Adobe Photoshop. Denne funktion tillader behandling af hele
mapper/direktorier. Det tager ca. 10 minutter at fremstille billedfiler og thumbnails fra
et helt hæfte (60 .TIF-filer, hver typisk mellem 12 og 22 MB store)
For at sikre den bedst mulige farvelighed med plancherne i originalværket, publiceres
plancherne med 16 mio. farver. Gengivelsen af de mange farver er ganske afhængig af
modtagerens skærm. Er skærmen indstillet til 256 farver eller er den dårligt indstillet
kan farverne afvige meget fra originalerne.
- De originale filer
- De originale TIF-filer gemmes ukomprimeret på cd-rom-plader. Der kan være mellem 30 og
40 filer på én cd-rom. Når det er valgt ikke at bruge nogen form for kompression
skyldes det dels, at filerne så kan læses direkte fra CD-ROM'erne, og dels at risikoen
for datatab minimeres.
- Lagringen på cd-rom giver bl.a. mulighed for at fremstille nye og større billeder til
fremvisning via WWW, når gennemsnitsskærmen om nogle år har større opløsning end i
dag.
- En eventuel nykonvertering vil kunne ske på samme måde som den første konvertering
sker, nemlig ved hjælp af Adobe Photoshops makrofunktion 'Handlinger'. Det skønnes, at
en nykonvertering vil kunne ske i løbet af få dage.
Søgefunktionen
Indholdsfortegnelsen
Tillempning af Cosmos-WWW søgeskærmene
Indholdsfortegnelsen
Det er vigtigt,
at brugeren hele tiden kan skifte mellem søgefunktion og browsefunktion. Derfor er alle
Cosmos-WWW' søgeskærme blevet forsynet med en ekstra knap som linker til
billeddatabasens hjemmeside. Knapperne i Cosmos-WWW har en generel funktion for hvert
globalt bibliotek, og der er ingen mulighed for at tilrette henvisningsmålet i forhold
til den logiske base, brugeren har valgt. Derfor vil der i første omgang blive linket til
oversigtssiden over Flora Danica-hæfterne, senere vil der blive linket til en side, hvor
man vælger den 'database', man ønsker at browse.
Derudover er der ikke forskel på almindelig Cosmos-WWW-søgebillederne og
billeddatabasens billeder. Hjælpe- og informationsteksterne er naturligvis blevet rettet.
Opbygningen af databasen
Indholdsfortegnelsen
Billeddatabasen bygges op i DNLB's bibliotekssystem, Cosmos. Cosmos afvikles under
biblioteksprogrammet ALEPH.
Billeddatabasen ligger i et eget globalt bibliotek (en selvstændig fysisk base) i
tilknytning til bibliotekskatalogerne. At billeddatabasen ligger i sit eget globale
bibliotek giver adskillige fordele:
- Det er muligt at lave søgeregistre, som er specielt indrettet til en billeddatabase.
- Det er muligt at trimme ledetekster og fremvisningsformater specielt
- Det er muligt at indrette WWW-søgefunktionen specielt
Det er til gengæld ikke muligt at søge i både billeddatabasen og biblioteksdatabasen
på én gang. Det kan dog næppe betegnes som en ulempe.
ALEPH's mulighed for at fremstille en 'master'-post, som blot skal udfyldes med det,
som er specielt for den enkelte billedpost udnyttes naturligvis; det øger
katalogiseringshastigheden væsentligt.
Indtil videre er det tanken, at lade hvert indskanent værk få sin egen logiske
database. Dette er dog stadig genstand for overvejelser på DNLB.
Formatet
Indholdsfortegnelsen
Der er valgt en tillempning af MARC-formatet til billeddatabasen:
Formatet er under justering i forbindelse med indberetning af moderne latinske og
danske navne til databasen.
Felt |
Delfelt |
Beskrivelse |
Sysno |
|
Systemnummer. Tildeles af systemet |
Base |
|
Basenummer i DNLB's billeddatabase
Flora Danica: 70 |
00800 |
|
Sprogfelt med delfeltkode $$l
Flora Danica: $$llat |
00900 |
|
Felt/delfelt med kode for digitale værker. Altid $$at |
24510 |
$$a
$$p |
Titelfelt
Navnet i Flora Danica
Johan Langes navn fra Nomenclatura ... Indtastes ikke, hvis identisk med $$a |
26000 |
$$c |
Årstal |
30000 |
$$c |
Størrelse på billede |
44010 |
$$a
==$$v |
Seriefelt
Flora Danica: Flora Danica
Flora Danica: Hft. nr., Tab. nr.
Det dobbelte lighedstegn bevirker, at hæfte- og tavlenummer ikke trækkes til
sætningsregister. |
85600 |
$$u |
URL-felt. URL på det enkelte billede |
EXT |
$$p
$$c, $$x
$$n |
Henvisningsfelt i ALEPH-systemet
HTM
URL fordeles på $$c og $$x. Dette kræves af ALEPH
Felt til overskrivning af den tekst, systemet leverer. DNLB har valgt at lade dette felt
udfylde med et standard HTML-kald af det billede, som hører til posten
(<IMG SRC="...">) |
CORR |
|
Administrativt felt |
OPEN |
|
Administrativt felt |
INIT |
|
Administrativt felt |
Effekten af brugen af dette format er
- i søgefunktionen, at Cosmos-WWW automatisk viser det søgte (fx an plante) med
tilhørende oplysninger om navn, planchenummer, udgivelsesår m.v.
- i browsefunktionen, at der kan linkes direkte til et systemnummer, hvorefter Cosmos-WWW
viser det samme billede som i søgefunktionen
Senere ændringer af formatet
Indholdsfortegnelsen
Formatet vil undergå forandringer efterhånden som billeddatabasen bliver udvidet. Det
nuværende format er skabt for at tilfredsstille behovene ved oprettelsen af botaniske og
zoologiske billeddatabaser og er muligvis utilstrækkeligt til andre formål. Det vil dog
næppe give store problemer at udvide formatet.
Tilføjelse af nye oplysninger i posterne
Indholdsfortegnelsen
Der er truffet aftale med firmaet Biomedia om supplering af Flora Danica-basen med
danske og nugældende latinske plantenavne; arbejdet udføres af Jon Feilberg og Henry
Nielsen. Disse oplysninger tilføjes ved masserettelser af poster.
Databasen leveres fra Biomedia som en regnearksfil. Konverteringen til Cosmos-format
sker via WordPerfect 6.1:
- Regnearksfilen gemmes som tekstfil. Felterne afskilles med en <TAB>
- Tekstfilen indlæses i WordPerfect, hvor den ved hjælp af to søg-og-erstat kommandoer
ændres til en datafil for brevfletning
- <TNL> ændres til <ENDRECORD><TNS>
- <TAB> ændres til <ENDFIELD><TNL>
- Herefter oprettes filen som datafil
- Der konstrueren en formatfil, som indeholder feltnavne og faste tekster (fx det meste af
URL)
- Fletningen foretages, hvorefter filen gemmes som tekstfil og er klar til batch
opdatering af Cosmos.
Tilsvarende metode vil kunne bruges ved eventuelle senere masse opdateringer af
databasen.
Browsefunktionen
Indholdsfortegnelsen
Browsefunktionen giver mulighed for at blade gennem plancherne i samme orden som de er
i originalværket. Det er tanken at bygge en browsefunktion til alle billeddatabasens
delbaser, hvor det findes rimeligt. Browsefunktionen er afhængig af forlægget og vil
derfor sandsynligvis blive forskellig fra værk til værk.
Browsefunktionen giver mulighed for hurtigt skift til søgefunktion. Når man vælger
søgefunktion, bliver man ledt direkte til søgning i den relevante delbase af DNLB's
billeddatabase. Som nævnt kan det ikke lade sig gøre at henvise fra søgefunktionen
direkte til en del af billeddatabasen.
Browsefunktionens opbygning
Indholdsfortegnelsen
Her beskrives browsefunktionen for Flora Danica med ilhørende beskrivende tekster.
Bogværket Flora Danica består af i alt 54 hæfter (hft. 1-51 + suppl. 1-3), hver
indeholdende 60 plancher. I de fleste tilfælde er kun én plante afbildet på en planche;
især hen mod slutningen af værket er der dog mange plancher, hvor der er afbildet to
eller flere planter på en planche.
- Hjemmesiden for Flora Danica indeholder disse elementer:
- Sidehovede med mulighed for at vælge Søgefunktion og DNLB's hjemmeside
- Titeldel med navn og logo for projektet
- Link-del med mulighed for at vælge oversigtssiden over samtlige hæfter eller sider med
oplysende tekster om dels selve projektet, og dels om Flora Danica (bogværk og
middagsstel)
- Fra hjemmesiden kan man vælge en side med en oversigt over
samtlige hæfter. Siden indeholder disse elementer:
- Sidehovede med mulighed for at vælge Søgefunktion, Flora Danicas hjemmeside og DNLB's
hejmmeside
- Titeldel med beskrivelse og logo
- Link-del med mulighed for at vælge mellem samtlige 54 hæfter. Der er oplysning om
hæftenummer, planchenumre for de enkelte hæfter og udgivelsesår.
- Når man vælger et hæfte, får man en ny oversigtsside, med
en oversigt over 20 plancher. Hvert hæfte deles i i tre dele, fordi nedhentning af 60
thumbnails (à ca 5 kB) vii være alt for tidskrævende. De enkelte hæftesider
indeholder disse elementer:
- Sidehovede med mulighed for at vælge Søgefunktion, Flora Danicas hjemmeside, DNLB's
hjemmeside og oversigtssiden med hæfter.
- Titeldel med oplysning om hæftenummer, editor for hæftet og udgivelsesår.
- Link-del med tre links til hver en trediedel af hæftet
- Siderne med thumbnails, 162 i alt. Siderne indeholder disse
elementer:
- Sidehovede med mulighed for at vælge Søgefunktion, Flora Danicas hjemmeside, DNLB's
hjemmeside og oversigtssiden med hæfter. Desuden kan man vælge de to øvrige sider med
thumbnails for det pågældende hæfte
- Titeldel med oplysning om hæftenummer, udgivelsesår og editor for hæftet
- Link-del med 20 thumbnails. Thumbnails er organiseret i to spalter ved hjælp af
TABLE-tags.
Fremstilling af siderne med thumbnails
Indholdsfortegnelsen
Siderne med thumbnails er fremstillet således:
- Der er fremstillet en masterside med top og bund for siderne; mastersiden tilrettes
efter behov.
- Til brug for fremvisning af thumbnails foretages der et udtræk fra Cosmos i et særligt
indrettet format, som indeholder
- Systemnnummer
- URL for billedfilen
- Flora Danicas navn for planten
- Langes 'forbedrede navn'
- Denne fil passerer en makro i WordPerfect 6.1, som ved hjælp
af en række søg-og-erstat operationer fremstiller 60 skemarækker i HTML. Eksempel på før og efter makro.
- En trediedel af denne HTML-fil sættes ind i den tilrettede masterfil, og hver anden
rækkekommando fjernes, så siden kommer til at fremstå i to spalter.
Fremstilling af tre thumbnail-filer (et hæfte) kan alt inklusive ske på under 20
minutter.
Torsten Schlichtkrull, ts@dnlb.dk
© Copyright 1998 Danmarks Natur- og Lægevidenskabelige Bibliotek