數位出版與電子書標準格式規 範及相關技術 財團法人資訊工業策進會 創新應用服務研究所 周世俊
數位出版與電子書標準格式規範及相關技術
財團法人資訊工業策進會
創新應用服務研究所
周世俊
Agenda
• 電子書閱讀器主流產品及支援格式• 數位出版與電子書格式標準• 數位閱讀平台技術
電子書閱讀器主流產品及支援格式
Sony Reader系列‧ 基本介紹
– Sony Reader: Sony公司推出的電子閱讀裝置
‧ 支援格式– DRM Text : ePub (Adobe DRM protected), PDF (Adobe DRM protected), BBeB Book (PRS DRM protected)
– Image : JPEG, PNG, GIF, BMP– Unsecured Audio : Unsecured Adudio: MP3 (Non encrypted), AAC (Non encrypted)
– Unsecured Text : ePub, BBeB Book, PDF, TXT, RTF, Micrsoft®Word, (Conversion to the Reader requires Word installed on your PC)
‧ 功能特色– 黑白8色灰階(省電,低溫)– 觸控面版– 提供畫線備忘,寫註解功能– 支援記憶卡提高容量
‧ 營運特色– 可擴充記憶體,電子書隨身攜帶– 使用PC網路下載書籍,再透過USB傳到Sony Reader上
Amazon Kindle系列‧ 基本介紹
– Amazon公司推出的電子閱讀裝置
‧ 支援格式– Kindle (AZW), TXT, Audible (formats 4, Audible Enhanced (AAX)), MP3, unprotected MOBI, PRC natively
– PDF, HTML, DOC, JPEG, GIF, PNG, BMP 需經過轉檔
‧ 功能特色– 黑白16灰階(省電,低溫)
– 文章朗讀功能,目前可閱讀(及朗讀)書籍,blog,雜誌或其他內容
– 字典註解功能
– Whisper Sync Kindles 讓手機等多樣的裝置,閱讀同一本電子書(同步化)
‧ 營運特色– 強大的background (Amazon book store)連結網
路直接下載$9.99~$13.99 newspaper monthly $2.99 each book
– 免費的無線行動寬頻服務。Kindle使用美國電信公司Sprint的3G網路,這項月費60美元的服務由Amazon買單,因此Kindle可在美國任何地方上網
iRex系列‧ 基本介紹
– iRex Technologies公司推出的電子閱讀裝置
‧ 功能特色– 黑白16灰階(省電,低溫)
– 觸控面版
– 有SDK,可自行開發 (JAVA, Linux)
– 可擴充記憶體
– 無線網路與行動網路 (WiFi/3G)
– 可畫線註記 (觸控筆)
– 翻頁杆設計,最接近傳統書籍翻頁
‧ 營運特色– 與Barnes&Noble連鎖書店合作,擁有超過75萬種電子書可供下載
– 可透過無線網路或是行動網路進行購買
– 可讀取自己的文檔、部落格,遠超出電子書原有的範疇
‧ 支援格式– 支援.PDF, TXT, HTML, MOBI pocket;
– 圖檔支援.JPG, .BMP, and .PNG
電子書閱讀器 Sony Reader Amazon Kindle iRex DR800
灰階 16 16 16
觸控面版 YES NO YES
擴充記憶體 YES NO YES
無線上網 3G(AT&T) EVDO/CDMA 3G
支援格式
BBeB (LRF/LRX), PDF, EPUB, TXT, RTF, JPG, BMP, GIF, PNG, MP3,
AAC
Kindle (AZW and TOPAZ), PRC/MOBI (non DRM), TXT,
PDF, Audible (format 4, Audible Enhanced (AAX)),
MP3;
eReader, ePub, PDF, HTML, TXT, JPG, BMP, PNG
支援DRM BBeB, EPUB, PDF AZW and TOPAZ (USA only)
eReader, Adobe ADEPT
(EPUB/PDF), MobiPocket
USB USB 2.0 USB 2.0 USB 2.0
硬體閱讀器規格比較表
電子書閱讀軟體介紹
• Adobe Digital Editions• FBReader• Stanza
Adobe Digital Editions‧ 基本介紹
– Adobe公司推出的電子書閱讀軟體
‧ 功能特色– 整合Flash
– 觀看PDF檔,可自訂呈現方式(ex:畫面大小)
– 支援DRM (Adobe)
– 書籤及畫線註記功能
– 多國語言
‧ 營運特色– 免費使用,可整合Adobe自家產品,包含:DRM, Adobe InDesign(製作電子書), Flash,若要完整版本則需要付費。
– 除了桌機與筆電之外,與Sony合作。
– 有DRM防止盜烤
‧ 支援格式– 支援.pdf, .epub及XHTML-based格式
– 支援SWF (flash)
FBReader‧ 基本介紹
– Opensource軟體
‧ 功能特色– 跨平台(Linux, Mac, Windows及多種linux-based的行動裝置)
– 可直接讀取tar, zip, gzip與bzip2的內容
– 多國語言偵測
– 有超連結及全文檢索功能
– 畫面可旋轉(90, 180, 270)
– 末來將整合字典,自動播放功能
– 支援表格呈現(future version)
‧ 營運特色– 為Opensource,其License為GNU GPL。
‧ 支援格式– 支援.epub, pdf, Non-DRM的Mobipocket, html, chm, rtf, lrf, fb2
– 支援格式仍在增加中
Stanza‧ 基本介紹
– Lexcycle公司推出的電子書閱讀軟體,於2009年4月被Amazon收購
‧ 功能特色– 動態瀏覽書籍封面
– 自訂閱讀風格
– 可更換書籍封面
– 有同步記錄書籤,搜尋書籍功能
– 透過無線網路可同步閱讀資訊
– 線上購物,可自行新增購書網站
– Support DRM (iPhone/iPod)
‧ 營運特色– 原本以iPhone及iPod Touch為目標,善用App Store的通路,於New York Times及App store上大獲好評
– 被Amazon收購後,將被整進於Kindle之中
‧ 支援格式– 支援 .epub, HTML, PDF, Microsoft Word, and Rich Text Format
– DRM 目前只支援.pdb (iphone/iPod only)
Comparison
SoftwareAdobe Digital Editions
FBReader Stanza
廠商 Adobe Opensource Lexcycle/Amazon
免費 YES YES YES
DRM YES NO NO
Opensource NO YES NO
支援格式 Pdf and epubEpub, fb2, pdf, non-
DRM Mobi, chm, html, lrf
epub, .azw.html, .pdf, .txt, .rtf…等
智慧型手機另有專用型PDF
viewer Android iPhone/iPod, Kindle
專用型電子書閱讀器
Astak, Booken, COOL-ER, Elonex, Hanlin, iRex, Lbook,
Sony
iRex iLiad None
數位出版與電子書格式標準
IDPF與EPUB介紹
成員
電子書產業領導地位的國際性商業與標準組織,為了使電子書能夠成功的開拓市場,並便於閱讀系統(Reading System)之間的資料互通,制定OeBPS(Open eBook Publication Structure)標準,後演變成epub標準,作為電子書內容描述的標準規範。
Stanza FBReader閱讀器
epub意圖是作為一個文件格式資源和最終用戶的格式交換使用。基於這個原因,檔案收集到一個容器(container),便於傳播和使用。這種container通常是一個壓縮文件,但已被擴展重新命名為”.epub”。
EPUB Architecture (1)走OCF1.0(Open Container Format)規範(電子書容器格式),架構如下:
改副檔名.epub .zip ZIP解壓縮
下載
存放容器信息可另存放其他文件如下:(1)manifest.xml,文件列表(2)metadata.xml,後設資料(3)signatures.xml,數位簽章(4)encryption.xml,加密(5)rights.xml,權限管理
css,images對於書本的外觀定義
opf和ncx都是在說明文檔的順序和內容
opf檔:書籍基本資料及章節如何連接
ncx:書籍章節資料
Xml:書籍內文
說明此份文件格式為epub
EPUB Architecture (2)
Mimetype: 用於判斷檔案類型,告知此檔案為epub,同時可用zip去解壓縮。
container.xml:定義電子書的內容根目錄、rootfile及檔案類型。
EPUB Architecture (3)
fb.opf: 定義所有的內容元件,包含書籍的metadata的資訊,檔案描述。
fb.ncx: 定義電子書的目
錄章節資料。
EPUB Architecture (4)
main1.xml: 電子書正文,格式為XHTML。
格式 PDF EPUB AZW CEB
特色
•可跨平台•支援電子表單•文件內超連結的功能•文字檔中的格式、字體、版型和圖片可向量放大
•有目錄、書籤與批註等功•文件可設定不可複製、不可列印、需要密碼等功能
•可以儲存高解析度的圖檔直接輸出使用
•可跨平台•相容性大(supports CSS
styles, images in JPG, GIF, PNG and SVG format, and full XHTML.)
•防止盜拷•商業策略
• Kindle 2 supports the Kindle (AZW), TXT, Audible (formats 4, Audible Enhanced (AAX)), MP3, unprotected MOBI, PRC, PDF, HTML, DOC, JPEG, GIF, PNG, and BMP (through conversion) formats.
• 北大方正研發”高保真”技術,最大限度的保持原來的樣式
•與北大方正的DRM結合• Apabi Reader的指定閱讀軟件
• Apabi Reader具有字體縮放、作筆記、書籍管理、翻譯和文字部分拷貝功能
•網路書目來源多
缺點
•檔案複雜度與大小較耗資源• Adobe 1.4版之前有專利保護
無法進行文繞圖的編排 not fully support Portable Document Format (PDF),
•只有Apabi Reader能觀看•封閉格式 (北大方正的
DRM)• 不支援電子表單
用途•文件交換•文件列印•文件閱讀
•電子書閱讀呈現•電子書中介格式•可直接編輯內容
•電子書閱讀呈現•搭配kindle可做語音
•電子公文交換•電子出版
廠商
• Adobe, Enfocus, EskoArtwork, Art Work Conversion…等
• Kindle, Sony Reader, iRex
• IDPF聯盟: Adobe, Amazon, Sony, Taiwan Digital Publishing Forum
• Sony Reader, iPhone(stanza), PC(Windows, Mac)
•Amazon •Kindle, iPhone
•北大方正•PC (Windows)
未來性
已成開放標準(ISO 32000-1) 各大硬體廠商陸續支援讀取, 發展性高
只提供給Amazon的kindle閱讀裝置使用,發展受侷限
中國大陸,部分的公部門採用CEB作為電子公文傳遞格式
數位出版與電子書相關技術
數位閱讀服務架構數位閱讀服務平台
中繼檔格式轉換
書籍版權設定/管理
Reader
User
書籍購買入口網會員認證
金流機制
會員資料庫
個人雲端書櫃 3GWiFi
3GWiFi
版權同步管理
電話帳單付款
Provider
書籍電子檔
書籍資料庫
硬體DRM
本機書櫃
內容漫遊服務
.txt、.pdf、.ppt
、.html、.xml
.epub
格式轉換服務
搜尋服務
Epub轉檔流程
Converter ReaderReader
Creator
Creator FBreader
epub轉檔問題討論
‧使用Calibre open source 轉檔軟體進行轉檔測試‧以四種電子書閱讀軟體做顯示測試–Adobe Digital Editions–FBReader–Stanza–Ebook Viewer
‧測試案例–狀況一:Docx轉epub–狀況二:帶圖片的PDF轉epub–狀況三:HTML轉epub–狀況四:HTML DIV標籤之顯示問題–狀況五:Google圖書提供的epub
Docx轉epub之閱讀器顯示問題Adobe
Ebook viewer
FB Reader
Stanza
帶圖片的PDF轉epub之顯示問題Adobe
Ebook viewer
FB Reader
Stanza
HTML轉epub之顯示問題Adobe
Ebook viewer
FB Reader
Stanza
HTML DIV標籤之顯示問題Adobe
Ebook viewer
FB Reader
Stanza
Google圖書提供的epubAdobe
Ebook viewer
FB Reader
Stanza
Epub原始檔案分析‧轉檔後的epub檔案,其CSS 內無字體顏色、字型、大小等相關設定,表示轉換過程中,格式的設定沒有一起轉換。
‧轉檔後的epub檔案有包含 img Tag,部分reader卻未顯示,
‧以 Browser 開啟epub內的XHTML檔,與 Word所呈現的格式仍不相同
1. 轉檔時未將格式資訊一同轉換2. Reader 的顯示支援程度也不相同
問題探討‧Converter and Reader
–中文字型支援問題 (Adobe Digital Editions)
‧編碼Windows UTF-8、ANSI UTF-8–圖型格式支援問題
‧epub只支援3種:jpg, gif, png
–版面遺失
‧HTML → ePub 有分頁問題
‧格式未能完整轉換,如:Cascading Style Sheets(字體大小,字型,顏色⋯等)
數位閱讀服務平台架構
Sync service
Search service
CMS + Repository
Converter service
內容加密
DRM License
數位內容上架
Metadata儲存
電子書下載
專有名詞莘取
知識地圖生成
建立Index
.html書籍列表
同步(DRM及Content)
DRM Check
Decompress
Buy & DL
同步DRM
書籤
書籍加註
Pdf ePub 呈現界面最佳化
index
(DRM + Content)
會員資料庫
電子書資料庫
epub資料庫
~Thank You~