Chương 3: Độ đo tương tự dựa trên ontology 3.1. Khái niệm độ đo tương tự 3.2. Độ đo tương tự khái niệm dựa trên ontology Đối với mục đích của đồ án là nghiên cứu độ tương tự giữa các khái niệm trong một ontology để phục vụ cho việc sánh các dịch vụ web ngữ nghĩa, do đó mục tiêu đầu tiên là đo độ tương tự giữa các khái niệm trong cùng một ontology. Độ tương tự rõ ràng sẽ phụ thuộc vào thiết kế của ontology và nó dựa vào khái niệm rằng các cạnh trong một ontology thể hiện các khoảng cách giống nhau, nghĩa là tất cả các liên kết ngữ nghĩa là có trọng số như nhau. Trong [3] đã đưa ra một số phân tích về độ tương tự dựa trên cấu trúc phân loại, dựa trên nội dung thông tin và đo độ liên quan vector ngữ cảnh. Do ontology có cấu trúc phân cấp nên trong đồ án quan tâm đến phân tích độ tương tự dựa trên cấu trúc phân loại như [3] đã đề xuất với các độ đo cơ bản đã từng được đưa ra bởi Renisk, Wu và Palmer, Leacock và Chodorow... Có rất nhiều độ đo, và để chọn một độ đo tốt nhất cho việc cài đặt, đồ án sẽ xem xét cấu trúc phân cấp một ontology, và thống kê độ tương tự giữa hai khái niệm bất kì trong ontolog y đó sử dụng các độ đo đã nêu để so sánh. Ngoài ra [3] còn đưa ra một độ đo mới để tính toán độ tương tự ngữ nghĩa sau khi phân tích những ưu nhược điểm của các độ đo trên. Các độ đo đầu tiên khai thác các mô hình hình học được cung cấp bởi hệ thống phân cấp khái niệm. Tri thức miền được mô hình một cách rõ ràng trong một ngôn ngữ máy có thể đọc được mà chính thức hóa các khái niệm miền bằng cách sử dụng một thuật ngữ phổ biến và đại diện cho các quan hệ phân loại và không phân loại thông qua các liên kết ngữ nghĩa.Trong trường hợp này, cơ sở để tính toán giống với khái niệm là khoảng cách liên kết (inter-link distance). Độ đo tương tự như trực quan nhất của các khái niệm trong một ontology là khoảng cách của chúng trong ontology được định nghĩa là số lượng các quan hệ khái niệm cha/con (is-a) giữa chúng. Những đọ đo này sử dụng cấu trúc ontology phân cấp để xác định sự tương tự ngữ nghĩa giữa các khái niệm. Các ontology có thể được thể hiện bởi các cây có nút gốc, các nhãn và không theo thứ tự trong khi các cạnh giữa các khái niệm thể hiện cho các quan hệ, khoảng cách giữa các khái niệm có thể được tính bằng cách đếm số lượng của các cạnh trên đường dẫn kết nối hai khái niệm. Việc tính toán khoảng cách ontology dựa trên đồ thị chuyên biệt của các khái niệm trong một ontology. Đồ thị đại diện cho một framework đa kế thừa không phải là một cây nhưng là một đồ thị có hướng không tuần hoàn. Trong một đồ thị như vậy, khoảng cách ontology thường được xác định là đường dẫn ngắn nhất đi qua một tổ tiên chung hoặc đường dẫn ngắn nhất chung, có khả năng kết nối hai khái niệm thông qua các con cháu chung. Theo mục đích của nghiên cứu này, chúng tôi quyết định triển khai đặc tả dựa trên tổ tiên chung, dường như phản ánh tốt hơn sự hiểu biết cảm giác chung của sự gần gũi của hai đối tượng trong một phân loại.