亞太地區

Dewey® 服務

以 Linked Data 方式發行 Dewey Summaries

長久以來,OCLC 的杜威團隊就一直想要與 Linked Data 合作。 換句話說,就是將 Linked Data 原則應用在部份的杜威十進分類法上,並以小型「術語服務」方式來呈現資料。 在面對一般的 HTTP 要求時,這項服務應能以機器或人類可讀的杜威分類呈現來回應。 每個杜威概念都應該有一個 URI (若有可以提供有用說明的網頁更好),而非只是單一分類。 資料呈現的格式應該要能處理豐富的語意資訊,並且能讓使用者或使用者代理程式能夠憑直覺來探索資料。 對於更複雜的項目,這個服務就應該提供類似 API 的查詢存取。 最後,在非商業用途的使用上,所呈現的資料應該可以讓所有人重複使用。

隨之發展的 dewey.info

Tim Berners-Lee 的全新 Linked Data 文化術語「就是要原始資料!」,或許會讓它看似太簡單,而無法實際針對語意網來發佈互通的資料 (如果您想知道的話,Linked (Open) Data 是一個子集,使用的是來自語意網中如同夾心蛋糕似的橫剖面工具)。 其中一個可能的原因,就是週遭並沒有太多我們指定類型的資料,也就是大型多語通用分類系統。 有了這種語意豐富的資料,就會有「不知到底該找些什麽的焦慮」: 精確 Ontological (本體論) 模型的大寫「O」領域,或僅稍微加強語意之已發佈資料集的小寫「o」領域 (隨意加入一點 ontology (本體論)),但在許多可能的網域中都含有適用性。

目前看來,後者的做法似乎可以更有效地驅使我們面對許多不同但與任一者相關的問題。 我們必須為 DDC 找出一個 URI 模式,讓它可在分散式環境中作為 DDC 概念的永久性識別碼。 其次,我們想要測試 RDF 字彙 SKOS 來創造具代表性的模型,以便呈現 DDC 資料中某些最佳的部分 (語言獨立的識別碼、多語術語及語意關係)。 最後,因為 Linked Open Data 並非真的開放,使用前必須徵得他人同意。所以我們曾經想要測試Creative Commons 授權,以便針對非商業用途,讓重複使用 DDC 資料更為便利。

爲了測試是否能夠以及如何達成其中的某些目標,我們選擇了 Dewey Summaries ,看看能否根據 Linked Data 原則作為合適的資料集進行發佈。 Summaries 的最新版本,即 DDC 22 的前 1110 個分類,已經以網頁文件的格式提供一段時間了。 爲了拓展現在單純是標簽濃湯 (單語) 的可能應用方式,每個分類都以一個 URI 加以識別,且資料必須以可重複使用的方式呈現。

運作方式為何?

您是否曾經碰過某個杜威編號,例如 641,然後很想瞭解 (或讓您的使用者瞭解) 該編號的意義? 現在您可以使用一般的瀏覽器,然後使用以下 URL: http://dewey.info/class/641/。 這個 URL 是一個識別碼,代表的是 DDC 的「641」分類,並將一般的網路瀏覽器自動重新導向至該分類所有可用語言、所有可用版本之 HTML 表示法 (http://dewey.info/class/641/about)。 「/about」的部分表示此 URL 代表抽象概念 (即杜威 641 分類) 的通用敘述,但不是概念本身。 概念本身是一個抽象的內容或想法,並沒有可以傳送到網路上的表示法,所以網路伺服器會將使用者代理程式指向網路上某個可找到該概念說明的地方。

使用者代理程式及伺服器會在背景交涉此說明的特定格式。 如 Opera 或 Firefox 等一般網路瀏覽器,就會接收到該頁面的 HTML 版本。這個頁面同時也可以直接由以下網址取得:http://dewey.info/class/641/about.html。Linked Data 瀏覽器 (如 Zitgist) 會將資料以 RDF (資源描述架構,Resource Description Framework) 的版本呈現出來,且用其來建立自己的檢視

使用杜威號碼這類語言獨立的物件表示法,最主要的優點之一,就是在顯示分類說明或其他相關術語等語言相關的部分時,能夠很方便地在語言間的切換。 透過將語言標籤附加在通用資源 (以「/about」結尾) 的 URI 上,您就可以將範圍縮小為特定語言的版本: http://dewey.info/class/641/about.fr。(如果有其他語言的單一分類 HTML 檢視,也會顯示這些版本的連結。) 透過直接指定所需的格式來略過內容交涉的功能仍在此處: http://dewey.info/class/641/about.fr.rdf

最後,此服務提供了指定應識別或擷取之版本日期的可能性。 隨著新增服務更新,這項功能的效用也會越來越顯著。 透過在 URI ( http://dewey.info/class/641/2009/08/) 中指定年和/或月,該服務只會顯示符合該期間的概念。在此案例中是 2009 年 8 月。將以上所有元素都結合起來後,您就有了一個相當完整的杜威分類說明: http://dewey.info/class/641/2009/08/about.ar.html。杜威 URI 的原始計劃需要更精準地指定版本時間,如分、秒。 這應該是未來發行版本的一部分。)

某些為此服務加值的其他功能有點太技術性,而無法在此完整說明,但應該至少稍微帶過。 使用名為 RDFa 的 W3C 標準,HTML 檢視的語意實際上已經相當豐富。 使用能夠感知 RDFa (或 RDFa 抽取器) 的瀏覽器,能夠開啟獲得、收集與連接杜威資料的全新可能性。

其次,dewey.info 使用 SPARQL 來顯示簡單的 API;SPARQL 是專為語意網頁所開發的標準搜尋技術。 有冒險精神的朋友應該會對這種範例查詢感興趣,因為它可以使用法文來擷取杜威的主要分類。

有哪些好處?

Dewey.info 的主要用途在於對 Linked Data 日益茁壯的網路提出貢獻。因此,大部分使用應用到 Linked Data 的案例,也可以應用於 dewey.info。看看世界數位圖書館使用 Dewey Summary 資料的方式,我們就可以瞭解,在 dewey.info 的網頁提供此功能前,就可以進行某些比較,而不會有額外的取得和更動資料時的複雜度。

而如果您的中繼資料中已有杜威編號,您或許會考慮建立 dewey.info URI,並將它新增到或許已經存在的一般杜威編號。 您立即就能善加運用目前已設定好的所有九種語言。此外,您還可以享受未來新增之其他語言及其他資料更新。 這些編號會名副其實地“活起來”,並開始“說話”,讓您完整地使用杜威的全面功能,因為您只要點一下超連結,就可以存取這些實用且具敘述性的資料。 同時,透過在 URI 的工作中指定日期,即使更新了該杜威編號且同時變更其意義,您依然能夠可靠且持續地參考某個特定的表示法,並精準地找出版本、語言及內容格式。

未來的展望

您現在所見只是我們的第一步。 我們希望讓 dewey.info 成為杜威資料在網路上的平台。 Summaries 或許仍不是以此方式發佈之最具挑戰性或複雜的資料集,但未來將有更多的語言、更深入的資料及其他資料集的連結。 如果您認為這個資料太過偏狹 (目前的確是),何不開始加入一些您的連結?利用 Linked Data 的方式,您只要在資源資料中使用杜威 URI,就可以完成這個工作。 請記住,連結是雙向道!


瞭解更多内容

杜威分類法服務手冊封面

下載手冊
深入瞭解透過全球最廣泛使用的圖書館分類系統編列您的資料。


杜威部落格非常棒,提供分類問題的消息與觀點,以及有趣與獨特的 DDC 資源和新奇消息。 這個部落格讓您能夠很方便地將意見直接回饋給 DDC 編輯,幫助他們決定 DDC 的未來。

過去與已記錄的活動

此區提供過去與已記錄的杜威分類活動。

檢視所有 Dewey 服務的活動 »

最新消息

OCLC 擁有杜威十進分類法系統的所有版權。 Dewey、Dewey Decimal Classification、DDC、OCLC 以及 WebDewey 都是 OCLC 的註冊商標。