This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
依離線與線上:離線電子資源或稱為套裝電子資源,如磁片或光碟片等,此類資料因有獨立的實體,通常也會附開啟該資料所需的軟體及手冊。線上電子資源指儲存在遠端之資料庫,隨著資訊科技的發展,其類型也越來越多,其中又可分為靜態線上電子資源及動態電子資源,前者如電子書、電子期刊等,每一筆資料本身具有完整的單元,這種資料庫通常以帳號及密碼等方式控制使用權;動態的電子資源則指內容隨時在更新之資料庫,這種資料庫只有當下的資料才是正確的,前一刻之記錄已經過時。除了資料庫外,線上電子資源還有開放系統上之「有組織的公共通訊資料」(organized public communications),如 NetNews、討論群體
都柏林核心集(Dublin Core Metadata Element Set,簡稱 DC)是 1995年 3月由國際圖書館電腦中心(OCLC)和 National Center for Supercomputing Applications(NCSA)所聯合贊助的研討會,在邀請五十二位來自圖書館、電腦、網路方面的學者和專家,共同研討下的產物,目的是希望建立一套描述網路上電子文件特色的方法,來協助資訊檢索。因此在研討會的報告中,將metadata定義為資源描述(Resource Description),而研討會的中心問題是如何用一個簡單的 metadata 記錄描述種類繁多的電子物件。根據研討會的報告,都柏林核心集處理的對象,將祇限於「類文件物件」(Document-Like Objects,簡稱 DLO),亦即可用類似描述
Committee for Standardization / Information Society Standardization) 所接受,並被記錄為兩份網 際 網路 RFCs (Requests for comments) 文 件 , 此 外 也 出 現 在 W3C(WWW Consortium) 及Z39.50 標準中。同時已有三個國家採用都柏林核心集描述其政府資訊,以促進其政府資訊的搜尋,另外,至少還有五個以上的國家正在考慮將DC 列為國家資訊標準。
DC 並不想要取代其他的詮釋資料格式,而希望與其他的標準並存,使得一筆描述記錄中包含不同標準、簡單與複雜兼具的詮釋資料。如在 RFC2731 文件中所舉的例子就是混合HTML 和 DC 的實例。
DC 的簡易性有其優點也有其缺點,由於其簡易性,因而降低描述資料的成本並增進資訊的互通性,但相對的,也因其簡易性,而無法支援複雜且語意豐富的詮釋資料架構。事實上,都柏林核心集也在到底是要提供語意豐富的資訊或要增加資訊的可見度中做取捨。不過都林核心集鼓勵將複雜的詮釋資料架構組合到都柏林核心集中,以彌補此難以兩全的缺失。語意豐富的詮釋資料格式為了轉出或為了跨領域的資訊查尋也可以對映到都柏林核心集。換言之 ,簡單的 DC 記錄可以做為建立複雜的詮釋資料之基礎。
Dublin Core 最大的優點就在於簡單。開放的特性使得數位圖書館計畫可以採用十五個核心欄位擴展更細的詮釋資料格式,也可以採用第一層的十五個欄位作為跨系統的詮釋資料交換格式,或作為異質系統分散查尋的資料格式,如 Open Archive Initiative即支持Dublin Core
作為資料抓取之格式。不過,也由於 DC 的開放性,讓每一個要以 DC 為基礎來擴充格式的使用單位花很多時間去討論如何擴充。
2. DC 的欄位內容
The Elements
Element Name: Title 題名 Element Name: Title 題名 Element Name: Title 題名 Label: 題名 Title
Definition: 資源所賦予的名稱。A name given to the resource.
Comment: 題名是資源的正式名稱。Typically, Title will be a name by which the resource is formally known.
Element Name: 創作者 Creator Element Name: 創作者 Creator Element Name: 創作者 Creator Label: 創作者 Creator
Definition: 資源之主要創作者。An entity primarily responsible for making the content of the resource.
Comment: 創作者包括個人、團體機構或服務系統。Examples of Creator include a person, an organization, or a service. Typically, the
name of a Creator should be used to indicate the entity.
Element Name: 主題 Subject Element Name: 主題 Subject Element Name: 主題 Subject Label: 主題和關鍵詞 Subject and Keywords
Definition: 有關資源內容之描述。A topic of the content of the resource.
Comment: 可用關鍵詞或分類號來表示資源之內容,建議使用控制詞彙或分類表。Typically, Subject will be expressed as keywords,
key phrases or classification codes that describe a topic of the resource. Recommended best practice is to select a value from a controlled vocabulary or formal classification scheme.
Element Name: 簡述 Description Element Name: 簡述 Description Element Name: 簡述 Description Label: 簡述 Description
Definition: 對於資源之相關說明。An account of the content of the resource.
Comment: 簡述可包括摘要、目次、圖示資料之來源說明、或對於內容的文字敘述等。
Examples of Description include, but is not limited to: an abstract, table of contents, reference to a graphical representation of content or a free-text account of the content.
Element Name: 出版者 Publisher Element Name: 出版者 Publisher Element Name: 出版者 Publisher Label: 出版者 Publisher
Definition: 使資源可供取用者。An entity responsible for making the resource available
Comment: 出版者包括個人、團體機構或服務系統。Examples of Publisher include a person, an organization, or a service. Typically, the
name of a Publisher should be used to indicate the entity.
Element Name: 貢獻者 Contributor Element Name: 貢獻者 Contributor Element Name: 貢獻者 Contributor Label: 貢獻者 Contributor
Definition: 除創作者外,對於資源內容之創作有貢獻者。An entity responsible for making contributions to the content of the resource.
Comment: 貢獻者包括個人、團體機構或服務系統。
Examples of Contributor include a person, an organization, or a service. Typically, the name of a Contributor should be used to indicate the entity.
Element Name: 日期 Date Element Name: 日期 Date Element Name: 日期 Date Label: 日期 Date
Definition: 在資源生命週期中,某事件之日期。
A date of an event in the lifecycle of the resource.
Comment: 日期通常可用來表示資源的創作或可供使用的時間。建議遵循 ISO 8601 [W3CDTF]之規範著錄日期,即以
DD 的格式著錄。
Typically, Date will be associated with the creation or availability of the resource. Recommended best practice for encoding the date value is defined in a profile of ISO 8601 [W3CDTF] and includes (among others) dates of the form YYYY-MM-DD.
Element Name: Type Element Name: Type Element Name: Type Label: 資源類型 Resource Type
Definition: 資源之性質或類型。The nature or genre of the content of the resource.
所定義的詞彙(DCMI Type Vocabulary, DCT)。資源之實體或是數位媒體之描述,則使用
Type includes terms describing general categories, functions, genres, or aggregation levels for content. Recommended best practice is to select a value from a controlled vocabulary (for example, the DCMI Type Vocabulary [physical or digital manifestation of the resource, use the FORMAT element.
Element Name: 資料格式 Format Element Name: 資料格式 Format Element Name: 資料格式 Format Label: 資料格式 Format
Definition: 資源之實體或數位化媒體之描述。The physical or digital manifestation of the resource.
量資料則包括高廣尺寸與放映時間。建議使用控制詞彙,如網路媒體類型 MIME (Multipurpose Internet Mail Extensions)
所定義的電腦媒體格式。
Typically, Format may include the media-type or dimensions of the resource. Format may be used to identify the software, hardware, or other equipment needed to display or operate the resource. Examples of dimensions include size and duration. Recommended best practice is to select a value from a controlled vocabulary (for example, the list of Internet Media Types [MIME] defining computer media formats).
Element Name: 識別碼 Identifier Element Name: 識別碼 Identifier Element Name: 識別碼 Identifier Label: 資源識別碼 Resource Identifier
Definition: 資源在某環境中明確的辨識資料。An unambiguous reference to the resource within a given context.
Object Identifier),以及 ISBN (International Standard Book Number)等。Recommended best practice is to identify the resource by means of a string or number conforming to a formal identification system. Formal identification systems include but are not limited to the Uniform Resource Identifier (URI) (including the Uniform Resource Locator (URL)), the Digital Object Identifier (DOI) and the International Standard Book Number (ISBN).
Element Name: 來源 Source Element Name: 來源 Source Element Name: 來源 Source Label: 來源 Source
Definition: 說明衍生出本資源的原始資源。
A Reference to a resource from which the present resource is derived. Comment: 本資源可能完全或部份由原始資源衍生而出。建議利用字串或數字所組成的識別系統來表示其原始資源。
The present resource may be derived from the Source resource in whole or in part. Recommended best practice is to identify the referenced resource by means of a string or number conforming to a formal identification system.
Element Name: 語文 Language Element Name: 語文 Language Element Name: 語文 Language Label: 語文 Language
Definition: 資源內容之語文。A language of the intellectual content of the resource.
Recommended best practice is to use RFC 3066 [RFC3066] which, in conjunction with ISO639 [ISO639three-letter primary language tags with optional subtags. Examples include "en" or "eng" for English, "akk" for Akkadian", and "en-GB" for English used in the United Kingdom.
Element Name: 關連 Relation Element Name: 關連 Relation Element Name: 關連 Relation Label: 關連 Relation
Definition: 相關資源之參照。A reference to a related resource.
Comment: 建議使用字串或數字所組成的識別系統來辨識參照資源。
Recommended best practice is to identify the referenced resource by means of a string or number conforming to a formal identification system.
Element Name: 時空涵蓋範圍 Coverage Element Name: 時空涵蓋範圍 Coverage Element Name: 時空涵蓋範圍 Label: 時空涵蓋範圍 Coverage
Definition: 資源內容所涵蓋之空間或時間。The extent or scope of the content of the resource.
用控制詞彙(如 Thesaurus of Geographic Names [TGN]),並使用數字表示地理座標或日期時間。
Typically, Coverage will include spatial location (a place name or geographic coordinates), temporal period (a period label, date, or date range) or jurisdiction (such as a named administrative entity). Recommended best practice is to select a value from a controlled vocabulary (for example, the Thesaurus of Geographic Names [TGN]) and to use, where appropriate, named places or time periods in preference to numeric identifiers such as sets of coordinates or date ranges.
Element Name: 權限管理 Rights Element Name: 權限管理 Rights Element Name: 權限管理 Rights Label: 權限管理 Rights Management
Definition: 有關權限的相關資訊,包括資源原有的或被賦予的權限。Information about rights held in and over the resource.
Typically, Rights will contain a rights management statement for the resource, or reference a service providing such information. Rights information often encompasses Intellectual Property Rights (IPR), Copyright, and various Property Rights. If the Rights element is absent, no assumptions may be made about any rights held in or over the resource.
TEI 是由電腦與人文學會(Association for Computers and the Humanities,簡稱 ACH)、計算語言學會(Association for Computational linguistics,簡稱 ACL),文學與語言計算學會(Association for Literary and Linguistic Computing,簡稱 ALLC)等三單位合作的計劃,並組成技術委員會(Technical Review Committee)來負責 TEI 的發展。TEI 的目的是要為人文學的電子文獻定義一個通用交換格式。使用的對象包括人文學者、維護電子文件的圖書館員、出版界、與其他想製作傳播電子文件的人員。此一計畫名為 Text Encoding Initiative (TEI)。文件編碼(TEI)標準建立於 1987年,該標準制訂了國際間和各學科間的文件編碼標準,作為圖書館、博物館、出版社和個人在網路上編碼文字,以作為線上搜尋和教學之用。TEI協會於2002年 6月發佈新版的電子文件編碼指導手冊,稱為 P4,該手冊完全相容於 XML 標準,使其在 WWW 上更能有效使用。3TEI協會為一個非營利性的集團,其目的為維護並發展 TEI
EAD 的起源是從美國加州大學的柏克萊指引計畫(Berkeley Finding Aids Project)而來,計畫目標是要以電子型式的 finding aids,來盤點、清查檔案資料,並為其做索引。EAD目前是由美國國會圖書館的網路發展與 MARC 標準小組(Library of Congress, Network
Development and MARC Standards Office)所維護,並由美國檔案學會(Society of American Archivists)協助管理及發展,EAD利用層級性的架構,完整的描述檔案及手稿,希望能由描述性資料來協助檔案專家做深入的研究。
(3)特性
a) EAD 系統結構乃以 SGML DTD 為基礎,並參考 TEI Header,發展出 EAD finding aids
DTD,以對 finding aids 提供更深度的檢索。finding aid 並非物件本身,而是指引到其他物件的工具。EAD DTD(Encoded Archival Description Document Type Definition)在定義規範描述檔案及手稿有哪些資料項及其屬性為何,並以層級性架構反應資料的外在層級(資料的來源與編排)與內容層級(專家對資料項內容的描述)。EAD DTD 的設計,在原則上先研究一份 finding aid 會有哪些資料項(element)?每個資料項可能會有哪些屬性(attribute)?又每個資料項之間的關聯性、層級關係為何? 將可能重覆使用的資料項及屬性等作群組宣告,以簡化 DTD 及維持其結構性。
b) EAD的資料描述項目多而完整,與其他種類的詮釋資料相容性高。EAD要對此主題領域的資料做詳盡的描述,由這些描述性資料來協助學科專家檢索此領域的資料,由於使用對象是學術研究者,必需對資料做完整的描述,所以 EAD的資料描述項目多,架構很完整。EAD DTD中的<eadheader>是參考 TEI header而來的,雖然不如 TEI詳細,但仍屬於
(四)政府資訊描述的 GILS (Government Information Locator Service)
1.簡介 5
「政府資源索引服務」(GILS, Government Information Locator Service),係利用網路和ANSI Z39.50 標準來執行檢索的系統,是專為政府資訊設計的一種 Metadata格式。由於美國政府各聯邦機構的資料原是分散的,需要一種能協合各機構資源和資料傳佈的工具,於是成立 IITF(Information Infrasture Task Force)資訊基礎建設小組,推動一個以機構為單位的政府資訊指引服務。1994年 12月 FIPS 192(Federal Information Processing Standard)通過了GILS profile,同時間OBM Bulletin95-01 公布,正式建立了 GILS,並要求所有政府單位機構必須在 1995年 12月 31日前實行GILS檢索系統的使用。美國NIST(National Institute of
Standards and Technology)國家標準暨技術局已規定所有聯邦機構必須採用 GILS 來指引文件出處。1995年 11月加拿大財政部亦成立一個相當於美國 FIPS 的工作小組,規劃以 GILS
做為 TBITS(Treasury Board Information Technology Standard)財政資訊公布的標準,並於1996年 1月開始進行此項先導計畫。
項目 18、Schedule Number (目錄編號):必須著錄項(若所描述的對象是自動化資訊系統或因應紀錄管理需求時,否則為選擇項)、不可重複、控制語彙。
例:Schedule Number:Scheduled:NCI-442-80-008/117A。
項目 19、Control Identifier(控制識別碼):必須著錄、不可重複、控制語彙。〔機構縮寫名稱請參照 U.S. Government Manual。〕
例:Control Identifier:USGS000145。
〔本項記載此筆紀錄的創造或最後修改機構,機構縮寫名稱請參照U.S. Government Manual。〕
項目 21、Original Control Identifier (原始控制識別碼):選擇項、不可重複、控制語彙。
〔當中介機構修改某筆 GILS 紀錄時,若將其自身編號填入 Control Identifier,則須要在此填入原始的 Control Identifier,以便回溯追蹤。〕
項目 22、Date of Last Modification (最後修改日期):必須著錄、不可重複、控制語彙。例:Date of Last Modification:19961108。
(五)地理資訊描述的 CSDGM (Content Standards for Digital Geospatial Metadata)
CSDGM(Content Standards for Digital Geospatial Metadata) 是美國聯邦地理資料委員會 FGDC(The Federal Geographic Data Committee)訂定之描述空間數位資料目錄的標準格式。CSDGM Version 1 (FGDC-STD-001):提供了後設資料應用的基本架構(framework),並於 1994年 6月 8日獲得認可。 CSDGM Version 2 (FGDC-STD-001-1998):取代原先的 CSDGM v1(但仍保持相容性),增加了簡介(profile)以及使用者自訂元素,於 1998年 6月 19日獲得認可。 http://geology.usgs.gov/tools/metadata/standard/metadata.html
access point 中。CHIO access points,描述了文件的重點,也是使用者在查詢檢索文件時所用的檢索點 。CHIO access points採用了 CDWA (categories for the Description of works of Art)與 CIDOC model 的描述項目,CHIO access points 包括:award、bibliography、concept、context、context-archaeological、context-