一、概述?
1.數(shù)字圖書館的產(chǎn)生背景和意義?
◆互聯(lián)網(wǎng)的發(fā)展使得人們能夠跨越時空的界限共享資訊;
◆"科教興國"是國家的長遠(yuǎn)戰(zhàn)略;
◆知識經(jīng)濟(jì)的時代已經(jīng)來臨;
互聯(lián)網(wǎng)的普及,使在線教育(網(wǎng)上教育)逐步成長起來,在不久的將來,開展網(wǎng)上教育成為未來教育產(chǎn)業(yè)的大勢所趨。
隨著信息技術(shù)的發(fā)展,需要存儲和傳播的信息量越來越大,信息的種類和形式越來越豐富,傳統(tǒng)圖書館的機(jī)制顯然不能滿足這些需要。因此,人們提出了數(shù)字圖書館的設(shè)想。
2.數(shù)字圖書館的定義?
數(shù)字圖書館是一個電子化信息的倉儲,能夠存儲大量各種形式的信息,用戶可以通過網(wǎng)絡(luò)方便地訪問它,以獲得這些信息,并且信息存儲和用戶訪問不受地域限制。?
數(shù)字圖書館是傳統(tǒng)圖書館在信息時代的發(fā)展,它不但包含了傳統(tǒng)圖書館的功能,向社會公眾提供相應(yīng)的服務(wù),還融合了其他信息資源(如博物館、檔案館等)的一些功能,提供綜合的公共信息訪問服務(wù)??梢赃@樣說,數(shù)字圖書館將成為未來社會的公共信息中心和樞紐。體現(xiàn)了信息化、網(wǎng)絡(luò)化、數(shù)字化的大趨勢。
3.外圍環(huán)境
目前,世界各發(fā)達(dá)國家都投入了大量的資源,加緊建設(shè)數(shù)字圖書館。例如,美國國家自然科學(xué)基金投資1億美元建設(shè)的NSF/A8PA/NASA數(shù)字圖書館將涵蓋大規(guī)模的文獻(xiàn)庫、空間影院庫、地理圖源、聲像資源庫,美國還投資3000萬美元建設(shè)美國數(shù)字圖書館聯(lián)盟項目,重點是美國歷史與文化成就信息。
日本要在2002年完成日本國圖書館關(guān)西館工程,計劃成為日本*大的數(shù)字圖書館及亞洲地區(qū)的文獻(xiàn)中心。這些情況都表明,發(fā)達(dá)國家都把數(shù)字圖書館的建設(shè)作為未來社會文化建設(shè)的一個重要內(nèi)容,加以高度重視。
4.數(shù)字圖書館涵蓋的內(nèi)容 ?
◆一定規(guī)模并從內(nèi)容或主題上相對獨(dú)立的數(shù)字化資源;
◆可用于廣域網(wǎng)(目前主要是INTERNET)服務(wù)的網(wǎng)絡(luò)設(shè)備和通信條件;
◆一整套符合標(biāo)準(zhǔn)規(guī)范的**的數(shù)字圖書館運(yùn)作建設(shè)流程和分階段的實施方案。
數(shù)字圖書館主要包括以下幾個重要的系統(tǒng)工程
1、信息的獲取與創(chuàng)建--圖書數(shù)字化加工
2、存儲與管理--搭建海量網(wǎng)絡(luò)存儲機(jī)制
3、訪問與查詢--搜索引擎、標(biāo)準(zhǔn)分類檢索系統(tǒng)
4、權(quán)限管理--在線閱覽系統(tǒng)
5、動態(tài)發(fā)布--web數(shù)據(jù)庫、中間件
5.數(shù)字圖書館的優(yōu)勢
?傳統(tǒng)圖書館 | ?數(shù)字圖書館 | |
?圖書館建設(shè) | ?書刊采購 | ?由數(shù)字化資源創(chuàng)建 |
?圖書資源保存 | ?典藏 | ?存儲(多媒體數(shù)據(jù)庫) |
?查詢檢索方式 | ?編目 | ?識別、標(biāo)引并生成索引 |
?服務(wù)方式 | ?借閱流通 | ?基于互聯(lián)網(wǎng)的分類檢索系統(tǒng) |
?控制 | ?流通管理 | ?權(quán)限管理 |
6.數(shù)字圖書館的實現(xiàn)手段?
將現(xiàn)有物理館藏采用各種先進(jìn)的數(shù)字化手段加工成為電子圖書。
通過專業(yè)的識別、標(biāo)引、分類檢索、互聯(lián)網(wǎng)發(fā)布系統(tǒng)整合建成數(shù)字化的閱覽環(huán)境。利用權(quán)限訪問機(jī)制以供讀者遠(yuǎn)程實時的調(diào)用閱覽。?
公司專業(yè)從事紙質(zhì)圖書文獻(xiàn)的數(shù)字化加工,將圖書文獻(xiàn)資源制作成符合國際標(biāo)準(zhǔn)的數(shù)字資源,進(jìn)行深度數(shù)據(jù)加工和加密處理,制作成全文檢索數(shù)據(jù)庫供戶使用,非常適合于圖書館、出版社、期刊雜志、各類企事業(yè)單位以及個人用戶。
7. 圖書文獻(xiàn)數(shù)字化管理
?
二、 建設(shè)數(shù)字圖書館的流程
(一)、圖書數(shù)字化
圖書數(shù)字化是建設(shè)數(shù)字圖書館的基礎(chǔ),圖書數(shù)字化的*終目的是生成可以在線瀏覽和在線借閱的電子書籍。也就是說,數(shù)字圖書館的館藏是電子書籍,電子書對于數(shù)字圖書館的意義就如同水對于河流,車輛對于高速公路一樣。
電子書籍--是由物理書籍經(jīng)過圖書數(shù)字化的過程加工而成。然后采用識別、壓縮、合成、標(biāo)引等等環(huán)節(jié)生成一定的格式。常見的電子書格式有方正的ceb格式、超星的pdg等等。
(二)、圖書數(shù)字化加工工作流程
數(shù)字圖書館需要高質(zhì)量的電子圖書。如何快速、高保真的將圖書加工成為電子書籍,是建設(shè)數(shù)字圖書館*重要的部分。?
在各種類型文檔影像資料加工流程之中,對圖書的數(shù)字化要求非常高。這表現(xiàn)在質(zhì)量和效率兩個方面。因為,圖書數(shù)字化的目的是*終建立"數(shù)字圖書館",便于讀者在線查詢借閱。所以很多參考指標(biāo)都會影響到*終電子書的質(zhì)量和可用性。
圖書數(shù)字化,又稱"圖書資料加工"。是建設(shè)數(shù)字圖書館的核心環(huán)節(jié),是*重要的流程。
圖書數(shù)字化流程大致包括:
◆ 圖書分解
◆ 圖書掃描
◆ 識別
◆ 生成電子書
◆ 自動標(biāo)引
◆ 建立標(biāo)準(zhǔn)分類體系
◆ 互聯(lián)網(wǎng)發(fā)布(采用先進(jìn)的大型數(shù)據(jù)庫技術(shù)和中間件)
◆ 搭建訪問控制權(quán)限系統(tǒng)(基于網(wǎng)絡(luò)的全數(shù)字圖書借閱系統(tǒng))?
◆ 面向訪問者開放
(三)、 圖書數(shù)字化加工的要求:
1. 保證字體還原度--充分保持書籍中漢字字體的原貌。
2. 電子書的圖像質(zhì)量和頁面質(zhì)量--去除頁面上的噪聲,得到高質(zhì)量的圖像,便于閱覽和未來進(jìn)行全文識別。
3. 加工效率--數(shù)字資源的快速建設(shè),提高單位時間的產(chǎn)出。
4. 全部工序集成--易管理,可控制進(jìn)度和質(zhì)量。
(四)、?圖書數(shù)字化工序
1.圖像掃描
對特色圖書、期刊、論文進(jìn)行篩選后進(jìn)行掃描??梢圆捎酶咚賿呙鑳x進(jìn)行快速圖像采集,也可以采用平板掃描儀進(jìn)行不拆分掃描,生成TIFF、JPG、PDF等圖像格式。在掃描過程當(dāng)中保證沒有少掃漏掃現(xiàn)象。
2.圖像處理
修圖組是對掃描完的電子圖像進(jìn)行去污、校正等增強(qiáng)處理;提高識別率和增強(qiáng)美觀度,如格式轉(zhuǎn)換、動態(tài)二值化處理、自動校正、自適應(yīng)紙張大小、灰度加強(qiáng)和去黑邊等功能。同時修圖組還進(jìn)行質(zhì)檢圖像模糊、原稿殘缺、補(bǔ)掃、漏掃、圖片不完整、多圖重疊等圖像問題。
?3.識別與校對
采用OCR軟件支持對掃描的圖像文件進(jìn)行文字識別,生成文本文件。興源科創(chuàng)采用國際**的OCR識別技術(shù),既可以識別常見的簡體漢字、繁體漢字、英文,也可以識別日文、韓文、俄文、德文、法文等190多種文字,超強(qiáng)的版面分析能力,*大限度減少手工操作量,識別準(zhǔn)確率高達(dá)99.8%。
?4.轉(zhuǎn)換成雙層PDF格式
轉(zhuǎn)換成雙層PDF格式,可以對圖像內(nèi)容進(jìn)行全文檢索,檢索結(jié)果定位到文檔所在頁面的具體位置,文件內(nèi)容原版顯示,無須二次排版。
?5.質(zhì)量檢查
質(zhì)量檢查員對加工完成的成品數(shù)據(jù)進(jìn)行抽查,主要檢查圖像清晰情況、目錄準(zhǔn)確性、有無缺頁少頁。
?6.索引制作
按照索引項目利用所提供的軟件進(jìn)行標(biāo)注或人工標(biāo)引。
?7.索引質(zhì)檢
檢查索引的文字正確性與索引的字段標(biāo)識。
?8.成品驗收
對圖像、文本與索引進(jìn)行全面的質(zhì)檢,合格后提交成品。
?9.光盤刻錄
將加工完成并檢查合格的成品數(shù)據(jù)刻錄到數(shù)據(jù)光盤(DVD)中,保證光盤讀取正確,如果數(shù)據(jù)量大則使用移動存儲保存加工后的成品,交付給用戶。
10.?dāng)?shù)據(jù)加密
通過數(shù)字版權(quán)保護(hù)技術(shù)(DRM)將電子文檔進(jìn)行加密處理,例如數(shù)據(jù)庫加密、文件加密、口令保護(hù)、軟件序列號認(rèn)證、硬件加密等,有效保證數(shù)據(jù)安全。