Top Banner
7

Unsupervised Italian word sense disambiguation using WordNets and unlabeled corpora

Apr 24, 2023

Download

Documents

kenneth gergen
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Unsupervised Italian word sense disambiguation using WordNets and unlabeled corpora

���������� �� � � ��� ����� �� ���� ��� ����������� � ��� ���� ������

���� ����� ��� ������ �������

������ �� ������� ��� ����� ������������� ������ ����������

�������������������� !�� ���

��������

���� ����� ������ � ��� �������� ����������� ���� ���� �������������� ����� ������� �� �� � ��������� �������� �� ���� ������� �� ����� ���� � ��� �� ���������� ������ ���� ���������� ��������� ���� ����� ����� �� ��� ��� �� ��� ����� �� ���������� ��� ��������� ��������� ������������������ � �� ��������� �� �� ����� ����� � ��� ���� ���� �� ����������� ���� �������� � ��� ��������� � � ��� ��� ���

� ���������

��� ��� �� ��� ����� �� � ����� � ������������ ���� ���� ������������ ����� ���������� �� ��� ����� ��� �� �� �� ����� ���� � ��! ����� ���������� � �� ������

���� �������� "#�����!� � � �� $%%&'� (�� ������ ������� ���� ������ �� ����� ���� �� ��� �� ������� �� ������ ���� ���������� �������� ��� ������� ����� ������� ������ ���� ����� ��� �� )�$* ���� �� "&+�,*�� ���� ����� �������'� ��� �������� � ����� ����� ������� � ����������

��� ������ ����

-����� ���������� �� ������� �� ���� �� ������������� ���� ���� ������������ ".-/��������' ���� ��� ������� � �� ������ ������ � �� �� �� ��� ���� ����������������� .-/ ������� #�����!� "&001'���� � ���� ��� ���� �� "$�+ ����� ��' �������� � .-/ � ������ ����� � ������� ���2 �� � ������ ��� �� ���� � ������� ����� �� ��������� ��� ���� �� ���������� �������� -��34� "&00)' ������ ���� ������ ��

������� ��������� ����� �� ���� ��������� � � ��� �� ������� 5��� � ������ ���������� �� ������������ �� ��������� �� ��� ���� �� ���� ������ � ���� � �� �� ���������� 6������ �� 7���� "&00)' ��� � �8������ � ������ � ����� ������ �������� ���� ���� �� � ��� �� � ����� ����� ����� ������ � ���� ����

��� ������� �� �� ���� � ���� �� � ���� ������ ��� ������� .���9� "8� ��� &001' ������ �� �� ������� �� ������ �����������.-/ ������� �� ���� ���� �� :���! "&00;'��� ���� ������� � ������ �������� ����� ����� ��� �� ��� ����� ���� .���9� "8� ���&001'� � ��� � �� ����� ��������� �������� 8�<���� � � � "$%%&'� ����� ���� � �� ������ ��������� ���� ���� �� � :���! "&00;'��� ����� �� ��� �� �� ��� �� ���� � ��=�� ���� ��� ���������> �������� "?� � � � ��&00$'� �������� ���� �������� � �� ������

���� �� ��� � ������ ��!� ���� � ������ ���� ��������� :���� � � � "&00;' ���������� � ����������� ����� ���� � ��������� �� ��� ���� ����������� �� ���� ����������� �� �� �� ��� .���9�� ��� �� ���� ���������� ���� ���� � ��� ����� ���� -������ �� @���� �� �� ��� � ����� � ��������� ������ �� �������� � �� �� ��� .����9�� � � �������� ���� �� � ����� � �� ��������� ����� 8��� ��� �� 8� ���� "&000'��� �� ���� �� ��� .���9� � � ������� � �� ��� ������ ������� ���� ������ �� �� �� ���� ����� ��� .���9� � ������� ��A����� ������ ��� ���� �� ����� ���� �������� � ����� � ���� ���������� ��������

� ���! � �� ���� ����� �� ���� � ������������ 8���� � � � "$%%&' ���� � ���

�������� �� ����� ������� ������� ������������ ��� ��������� ��� �� ���� ��� �� �������

Page 2: Unsupervised Italian word sense disambiguation using WordNets and unlabeled corpora

��� �� �� ��� �� �� ����� ��� � ������� � ���� ��� �� ���� �� ��� ������� � ���� ���� � ����� ���� � ���������� � ����������� � � ����� �� ��� ������ �� ������ � ����� ���� ������ ���! � �� .���9������������������ ���� ���� ������������ ���

�� .���9� �� ���� � �� ��� � �� ��� ����� ��� ���� � ��!�� -��� �� �� ��� ��� ������ �� �� ��� B������� "&00+' "���� �� �������C������� �� ���� ���� .���9�' ��-���� "&00+' "���� ������� �� ���� ����������� .���9�'� ��� ���� ���� ���� ������������� � ������� �� ���������� �� ��������� ������� �������

� ������� �����������

� �� ���� ������� � ��� ��������� ��������� ��� ��������� �� ���� �� ����� ��C�� �����2 � ������� ��� ������ ����� ����������� ���� ��� � �� ��� �� �� ������D������E

� ���� � � � ��� �

�� �� �

��

���

����� �� �� �� ����� �� ���� �� ������ �� ���

����� � ������ �� � �� �� ����� �� ������ � �� �� �� � ����� ��������� ��� ��������� <������ ����� �� ���� ���� ����������� � �� �� � ������ �� �� �� ������� �� �������� �� ������ �� ��� ��� ���� ������� ��� "���� ������ �� ��F��� ���� ���� � �����!�� ������������ ����'�5 �� ������� ���� ������������� �����

���� �� �� �� ������ �� �� ������� ��������� 6(- ����� ��������� � -����� "&00G'�������� ���� �������� ���� �� �� ��� ������ ������� H -���� , ��� ���� �������� ����� �����4��� �� � ����� ������� �� � ������� �������� � ����������� ������� I�����4��� �� ��������� ����� �� ���������� ������ ����� �� �4�� ����

����������� ��� � ��� � ��� ��� ��� ��� �������� �� ������ ��� ������ �����!� ���� ��� ��"#������ ��� � �����

�$ %������ ��� #� � ���� � ����� �� � ����������& ��� ����� ���� ������ ���� �� ������� #����'�� #����

���� ����� �� �� ���� �� ��� � � �% ��� %��"���� �� ( %�� ��� #��"�%"��� %�������� ���� ������� ��'����� �� �������� �� ��� �������� #�������� ������ ��� ��� ��� %������� ���� %�� �!����������� %������� �� �� � �� ������� ��������� ���������� '���� ���� �� � ������� )������ ����� ������"*����

������ �� �4�� 6(- ������!� ��� �!� ���

����� 0)�&* 00�%* 00�0* 00�G*��� 00�1* 0)�;* 0,�$* 0G�)*��J� 0,�;* 00�,* )1�+* 0)�%*

���� �E I�����4��� �� 6(- ����� ���������

#�����!� �� .������!� "$%%%'� ����� ��� ���� ���� �� �� 6(- ������ .� ������ �������� �� �� ������ ����� �� �4�� ������� � �� ���� 1%% ��J������� 1%% ��� ��1%% ������ � �������� � ���� �!� ���A����� �� ������ ������ �� ��� ��� ��������!�� �� � ���� ����!��� ��� � & ������ ��6(- �� �����4��� �������� ��� ���� &1%%�����2 �� �����4��� �������� �� �������� � � ����� �� ����� ���� ������ � ��� ���� �� 6(- ������

� �������� �������

��� ������� �������

-��� � ����� ��� ��� ���� �� � ��� �����!� �� �� � � � ������ ������� �� ��������� ��� ������ ���� � ���� ����� (� ����� �������� � ��� ������� �� �� �� .���9�������� &�%� ���� ���� �� �� �� �� 9���� 6��J��� -���5I ":����� � � �� $%%%'� �������� �������� ��� �� ���� ���� ������� ���������� ������� ������ �� �������� ���������� "���� � ����� �� ����'� �� ����E� ������ H ���� � �� � ����� �� ����

�� ���� � ��� ��� � �� ���� �� ��� ������ �

� ����� H ���� � �� � ���� �� ���� �� ����� � �� ���� ��� � ������� ��������

� �� ������ � ���� � �� � �������� ������ �� � �� � ����� �4��� �� ���� 2

� �� ���� H �� ������� �� �� �� �������� ���2

� ������� H ���� � �� � ������ �� ���� �� �� ��J�� ��������� �� � ��� �� ��J����������� �� �� � ��� "��� ������ ���� � ������ �� �����'2

� ������� H �� �� ������� �� ��� ���������2

�� .���9� �� � � ���� � ���� �� � ��������2� � �� ���� �� ���� �������� ��� �� ��!���� ��� ���� � ��� ����������

�$� ������*�� # ��� +,� ��������,% ��� -./-� � ����� ������ �� ��� 0���1���2���

��� 3�3 ��� ��'���� �

Page 3: Unsupervised Italian word sense disambiguation using WordNets and unlabeled corpora

:� ��� 9����� �� �� ����

�������C������ G&$,������C�� ��� &%,

����� ;%���� ,G���� 1;,

��� �� ���� G0G$

���� �E �� .���9� ������� ��� �� �������������

(� �� )+ ����� �� ��� ��� �� �� ��� ������ )$ �� ��� ��� ����� � �� �� .���9�2�� ����� ������ ��� � ����� ���� �� �������� ����� �� ��� � ��� ������ �� ���� ��� ���� ������ �� �� ���� ���� �� ����������� � �� � ���� ����� ��� � $ ����� �� ������ �� ��F��� �� ���� ����� � �� �� ������ .���9�������� �� ���� �� �� .���9� �� ����

��� ���� ����� �� ����� ��� ���� �������������� @�� ������ �� ������ ����������� �� ���� ��� ���� �� ��� ���� ������������� �� ���� �� ������� ������� ��� ���� �� ��� �� ������� � ������ ��������� ������2 ���� �� ��� �K����� ������� �������� �� �� � ������ ��������� �� �� ������

��� �������� �� ��� ������ �������

� ������ � �� ���� ���� �� �� ������ ���� .���9� ����� �!� � �� �� ��� .����9� ����� �� �� ����������� ��� ���� "���� ����'� � ���� ������ ����� ��� ���� ���� ������ �� � �� ��� � � �� ��� .���9����� �� ����� "���� �� �������� ��� ���������������'� ����� ��������� ������� ������� � � ������� �������� ������ H ������������ ���A���� �� ���� ���� �� ����� �� �� ��� .���9� "����� �� ����� � ������� &�;' "8� ��� &001'� ���� �������� �� ����� ���� � ����� ���� ���� � ���� ��� ���� ������ �������� "�� ������� � -���� 1'�-��� �� �� ��� ����� � �� .���9� ���

�� ����� � .���9� &�1� �� ���� �� ����������� ���� � ���� � ����� �� ���������� � /���L � � � "&000'��

������ �� �������� ���� �� �'����#��� ��� ����������� ��� #� ��4����� �� �������� ����� ����� $� ��"�������'� ���� #� �� �������� ��� ������ �� ����������*�������� ���� )������� ��� ������ ���� ��� ��� �������� ���� �������

���� �� ���� ��� �#������ %����� �������������� ���� ���� ����������

� ��� ��������

5 � ���� ��� � �� �������� � ������ ��� ������������� � ���� ������ �� �� ��������� ����� �� ��� ���� �� � ���� ��� ����� �� �� ���� ����� �� $�+ ������ ������� ����� �� ����� "�� ���� ����������� �� ���� ��� �'� ������ ���� �������� ���� ���� ������ �� ����������� M����� � ������ � ������ ��� �� ���� ��������� � �������� ��������! ���� � ��� ���

������ �� ����� � �� �� ���� ��������E

������� � �� ���� � ��� �� ���� �������� �� ��� ���� �� �� ���� � �� ���������� ������ � ���������� ������ �� � �� !��� � ����"� ������ ���� � �� ������#��� ���� ���

5������� & �� ��� � ���� ���� � � ���������� �� ����� �� ���� ��� ��������� �����F��� ����� �� �� ���� ���� � "���� �� ������ ����'2 � ��� ����� ������ ������������ ���� � �� ������� � ��� ����� �� ���� ��������� ��� �� ��� ���� � ��� ���� ���� � �� ����� ���������� � ������������� �� �������� � �������� �� �!� ������� �� ������ ����� �� �� �F�� �� ���������� ����� �� �� ������ ���� ���� � ������ �� �� ��� ��������� �� �� ���� �� ����� � ������� �� � ������ ��� ��� � �������� ������ �����

��� ������ !��� �������� "����#�

@��� � �������� ��� �� ����� �� �� �.���9� �� ��������� � �� � �� �� �� ����� �� �� � �� �� �� ��������� ������ @����� �� � ������ �� ������ � ����� �� �������� �� ���� �� ������ � ������� �� ������ � � ������ ����� �� �� �� ������� � �� ��� �� ��

� � ��� �� �� �� � ���� �� �

�� �� �� �� ����� �� �� �� ��

� � ����� ��� � �� ���� ��� � � ����

���� ��� � �� ���� � � �

��� ����� ��������� ��� � ����� � ����� �� ����� �� �� �� ��� ��������� ��� ������2 �� �� ������ ���� ������ �� ������������ �� ���� ������ "��� �� ������ ���������� ���� �� �����'��� ������ �� �� �� ����� �� ��� �� ���

� ����� ��� � ��������� ���� � �� ���

Page 4: Unsupervised Italian word sense disambiguation using WordNets and unlabeled corpora

���� �� ����� ����������� � ���� � � ���� ��� � � � � � �� ����� �� �� �� ����� ���� � �� ����� � �� �� ���

��� � � ������ � �� � � � ���� ��� ��� � ��

"&'

������ �� �� ����� �� �� �� ����� �� ����� ��� � �� ��������� ���� �� �������� �� �� ���� � � ����� �� ����� ��� ���� ���� ���� ����� �� ����� �� �� � ������� ������ �� �� �� ��� �� �������� ���������� �� ������� �� ���� �� ���� ������ �� � ���� �� ����� �� ����� ���������� ��� ���� ������ (�� �� � ��

�� �������� �� �� ����� �� ���� ���� � � ��������� ��

��� � � �� ���� �� �� �

� ��� "$'

�� � ���� � � � � ��� ��

� � ���� ��������� �� ��� � �� � ������ �� � �����

����� �� ��������� ��� ���� ���� � �

H ��� ��� �������� �� ���� � ������ �� � ���� �� �������� �� "������� ���� $�������%��� &��! &00+'� 5��� ������� �� �� �"11G+ �����2 ���� �� ���� ��� )+ ��������������'� �� �� ���� ����� ������ � ������ ������������ � ;%%8 ������� �

��� �������$ %��� "�������

5 ������ & ������ �� �������� M�������� � � ������ ���������� ������� �� �� ���J�� ����E ������� �� ���� ���� ���������� �� �� ��� ����� �� M����� � ���������� ���� ������� ��� ������� �� ������

���� ��� �� �� ����� ��2 ���� ���� ������� � ���� ���� � � ������ �� ������� �������� ���� �� ���� �� ������ �� ������ �� �� ���� ���� �� �� ������� H ��

� ���� �� ����� �� ������ �� ������������� H ��� ������� � �� ���� ������� "�A����� "G''� �� ������� �� ���� ���� ��������� ����������� ������ �� �� ���� ������� ������� ����� ��� ������ ������� ��� ������ ���� �������2 �� �� ���� ���� � �A����"G' �� ������� �� ���� ���� ��

��� ���� ��� � � ������� �� ����� �������

� ���� ";'5�%��������� � ��� '������ �% 0������ 1���2��

� ��� ������ �� ��� ��� � ����� ��#��� �% ��� ����"������ �� � ��� %����� �� ��� �� � � ��

�6�������� � ��� �� ��'���� ��� ����� ��� ������#��� ������� �����������

��������� � M�������� � .-/

&� 0� ��( ��� ��#������ ��� ��

$�7����� ��� �!������ ��� �% ������ �� �� ��"����#�� �� �8������ ����

+�9�� ���� ����� � � �� � ������ �����!�� �� ���"�������� � %��� � ����� ����#���� ��� ���

G�$����� ��� �����!�� �� �� ��������� ������ ���"

��� �� ��� ������ �% ��� � � �� � � � �� (

�� ��

� � ���� ��� ����

��� � �� "+'

1�7�� ��� ��� ��������� �% ���� �����!� �� ����"��� ������ �� ��� ���� ��� ���� �� ��� ����������� 9�� �!�� ��(

� ���� ��� �

� �����

����

� ������

����

� ���������

� ������ �-�

,�$����� ��� ��� ���� ��������� �� �� ������ ���#���� �� ��� ��������� #����� ��� ����������� ��� ��(

�� ��

�� �� � �������

� ���� ��� � �� ���

;�:� ��� %��� ��� 3 ����� ���'������� �� � ��"����� ���#�� �% ���������� �� ��������

)�7�����% ���� ���� �������� ��� ��� ����� ���"��� ������ �� ��� ������� ��������

�� � � � �� �����

� � � ��� �3�

�� ��!�� ��� �� �� �N�� 7���� ���������� �� ����� � ������ �� ��� ����������� �� ����� ��� ���

� ������� ��

� �����

����

� �����

�����

� �����

����

� �����")'

(��� ������ � ������� ��� �� ���� ������� ���� ��� �� ��� 7���� ���� "?� � � � �� &00$'

� ������� �� ����

� � ���

�����

� �����

� �� ���"0'

�� ����� ���� ����

� ������� ����� ���

����� �����"&%'

(�� �� ���� ������ � ������� ���� ��� ��������� �� ������� ����� �� �� ������ �� �

Page 5: Unsupervised Italian word sense disambiguation using WordNets and unlabeled corpora

�A���� "1' H �� ������ ������� ���� �"&%' �� � ��� �� H ���� ������ �� �������� ����� ������� ��� � ���� ����������� ����� ���� ����� 5 � ������ �� � ��� ���������� �������

�� ����

Æ

��� ���

���� ���� ��� � �

�� ��

"&&'

����� ���� ������ �� ������� � � � �������� � ���� � �2 Æ �� �� M����!�� ����� E

Æ ��� �� �

� �� � �� �

� �� � � �

!���� �������� �������

� �� A��� ����� ��� � � ���� ���� ��! � ���������� � �� �� � �������� �������2 � �� ������� � ������ ������ �� �� ���������� ��� ���� � ������� "�� �������� �� ������� �� �� �������' �� � � �������� �� ������� ������� ��������E

� ����� � � ���

-����� ������ � �� ������ ����� �������� ���� ���� �� ������� �� �������������� ���� ������ � ���� ��� � � � ���� �� �������� ����������� �� � �� �������� ���������� ��� � ����� ����� �� ��� ������ ������� ������� � ��F��� �������� ��������� ��� � ���� � ������ � "-����� ��.� !�� $%%&'� � ���� �� ���� ��� ��� � ������� ������� � ���� ��� ��� ���� ��� �� ����� �� ������ ���� ������ �� ������� ���� ���� �� � ���� �� �� ���� � ��� � ���������� ���� ��5���� ���� �� ���� �� �� � ���� �� ���

������� � -���� G� �� ���� ������ � �� ������������ �������E

� �� �� ��� ���������� ����� �� ����� ��� �� � ������ �� �� �� ��������2

� �� ���� �� ����� ���� ���� ������������� ����� "8���� � � �� $%%&'"��� ����� � ���� �� ��������� ������'�

� ���� �� �� ��� ���������� ���� �� ��!��� �� ���� ��������E

������� � �� ���� ���� ���� �� �� '����� ������� � ���� ��! ��� ��� ����� �� ���� �� � '����� �� ������������ �� ������� �� ���� �� � �����

7� ���� ��� ��������� �� ���� ������ ���� ��� �� ������� � 5 ������ $� �������� ��� � ���� �� �� �� ���� � ���� �� � ������ ������� � ���� ���� �� �� �� �� ��� ��� ��������� ������

��������� � )������ ;���"<���� 7�����*��

&� 9�� ���� ����� �� �% ��#������ ��� �

���� �� ���� ��

�� ���� ������ �� �

���� � ����

$� 7�� ��� ��� ����� ��#�#����

�� ���� ����� �� �����

���� �� ����

+� 9�� � ���� ��� � ������

�� � ����

�� ���

?��� � � ���� ��� "������ � ����� �������� ���� ����'� � ���� �� �F����� ����� ������� ���� ���� �� ������ ����"7�� �� .�� &00)2 �� �� ��� � � �� &00)2#�����!� � � �� $%%&'� �� ������� �� ����� ���� ���� ��

�� � �� ����

��

Æ ��� ��� ����� �����"&$'

����� ��� ��� � �� ���� �� ������ � ���� ���������� � ���� �� ���� ��� �� ���� ����� � ��������� ��� �!� �� ������� �� �� ������� �� ���� ����� � �� ��� �� ���� �� ��� ������� �� ��� ������

" #$�������� #%������

��� �� ��� � �� �� �� ����� ����� � ��!������ �� +))0 ����� �� & � + ������� ���)+ ��������� ������

&�� ��'��$� � (���������$�� ����!�

�� ��� �����$�

�� �������� �� ����� �� ���� �� ������� ����� �� �4��� �� ������ � ����� ��

� �������� ���� � � �����4�� ������� ���� ������ �� �� � �� ��� ������� ����� ��� ���������� ��� �K����� �� ����� �� ��� �� �� �.���9�� �� �� �� � ������ � ������ ���� � ��� � �����4�� ��� ���

������ ��� #����� �� %�'�� �% ��� ����� ���� � " ���� *��� �� ��� 0���1���2��& ���� ������� ��'���� ��%��� ��� #��� �� ��� ����� ��������� ������ �! ��������� �� ���� ���� ��� ����� �� ��!���"��� �������

Page 6: Unsupervised Italian word sense disambiguation using WordNets and unlabeled corpora

Sens

e C

lass

ific

atio

n A

ccur

acy

Size of unlabeled corpus (words)

34.5

35

35.5

36

36.5

37

37.5

0 1e+08 2e+08 3e+08 4e+08 5e+08 6e+08 7e+08

)���� �E -��� � ���� ���� �������� ���������� � ��� �� ������ ��4�

5� ������� � ��� � +� �� $� ���� �� � ����� �� �������� � ���������� ��� �� ������� ����� �� �4�� ��� ������ ���� �� �������� ������� ���������� � ;1* �� �� ������� � ������� ������� ���� �� ������2 ��������� ��� � ������ � �� ��

� �������� � �+G�,* ��������� ���� �� � ���� �� �� ����� � ������ �� �� �� ����� � ;1* �� ������ +,�,* "�� ���� � @����� &'�

��� � �����4�� �����D� ���������� ����� �������� � � �� ���������� ����������� ���� � � &%* �� �� ������� � ���������� � �!�� � ������ &% ���� ����� � ������ � �������� ��� �� ���� �� � ������������� ����� �� �����

&�� "���*$����� ����

@����� & ������ �� ���� � ������ �� �� � ������� ������� � -���� G� ��� ������ ��4���� �� � ��� �� ������� ��� ���������� ��������� ���� +G�1* � ;%8 ����� � +;�&* �;%%8 ����� "�� ��F����� � ���������� ��������� � ���� �� � � �� ���� ��� ������'�

��� ��������� �� �� � �� �� ����������� �� �� � ���� �� ��� ������� � ��� �+� ����� ��� ��� ���� ��� ����� ����� ���� ������� ����������� I�� & �� ��� � +����� �� ������� ���������� �� � ������� ������� � ���� � ������ � �� $� ������������ �� �� ����� �� ��� ���� �� ����� �� ����� ����� �����4���� �� ���������� � -���� ,�&� I�� G ������ �� ����������� �� �� M����� ����� ������� � -����� G� �� �� + ������ �� ���������� �� ��

����� ��������� �� ���� ��������� # ����� ������������ ���� ����& ��� ����� ����� %��� �����!����� #� ���������

� ���� $������ 9��� 7�����

� :����� 7����� /��=> "/ ?� ;�� ����� =-�@> -���>

= AB5.� =��=> -/�=>- � ";���� � ���� =@��> --�.>� ;������.� =��.> -3�=>

3 0������ ;��� <���� -.��> -��=>@ )������ ;��� <���� =���> -��=>

� 0";<��� C )";<�3� -3�-> ����>� 9���� � ���� ����� �����

�. ,����� ;��� <���� 3��-> 3��=>�� ,����� D����� @=�-> @@�.>

���� �E -��� � ���� ���� �������� ��� ��F���� �������� �� �� �����

������ ��� ������ ��� ��F����� ����� ��$ ������ ��� � � �� ��4� �� � ��� �� �������� A�� �� �� �����4����

6������ �� ��� ������� ���� � ��� � +�� �� ��� �� �� ������� �� �� ��� �!� ����� ��� � ���� ���� �� �� ��� ���� ������ � �� �� ������� �� �������� ������7� ��!�� �� ����� ���� �� ��� �!� ����� "�� �� ����� ���� �� �� � ������ � �������' ��� � ���� ����� �� ���������� ��������� �� ��� � G* " �� , � �� �� �'� ��� ���� �� ��� �������� ����� ���� ��

��� � ���� �� ����� � �� ���� ����������� �� �� ��� .���9�� ��������� � 5 ������$� ��� �� ���� ���������� " �� ;'� �������� ���� �� ��� ��������� ����� " �� 1'�

7� ������� �� �� ��� �!� � ������ "���� ������ � �� �� �� ��� �� ���� M����� � ������ �� �� �� ������ ���� ���� ��� .���9�'� �� �� ���� � �������������������� �� G,�G*� �� ����� �� ��� �������� ����� ���� �� �� �� ��������� ���������� �� ���� � ���������� �� G;�$*� �����F����� � ���������� ����� �� �� �������� �� �� �������� ������� � ���� ��� � �� ���� ��� �� %�%1�

5� � � ��������� � �� ����� ������������ � �� ������� � �����! �� ���� ���� � �� ��� � �� ������ ������ ���� ��� ��� ��������� ��� �� ���� �!� � ������ ����������� ���� � �� �� � � �� &%����� ���� � ����� ��� ���� ���� � �� =���>���� �!� � ���� "������� � �� �� ���'2� ����� � ���������� �� ,1�+*� ������� ����� �� �� ���� ���� � ������ � ������� ���� ���� � �� ����������� �� � #�������� �� ����� ����� �� ������ ���� �� � ���

Page 7: Unsupervised Italian word sense disambiguation using WordNets and unlabeled corpora

�� � ���� �� �������� �� " �� && �� ��� � +'���

& !������

� ��� ����� �� ���� ������� � ��� ������� ���� ���� � ���� ���� �� ���� ��������� �� � ��� �� ���� ���� ������ ��� ���� ��� � �� ���� �� � ����� �������� ��� ��������� ������� ���� !�� ����� ������� � ������� � ���� ����� ��������� ��� ���������� ������� ��� � �� ������ �� ��� ��� �!� � � ���� ����� �������� � ���������� �������� � ��� ����� ���� �� ��� ��� ���5� ����� ���!� �� � � � ������ ����

����������� ������ !�� ����C������� ���� ���� � � ���� �� � ���� ������� �������� �������� ������ �� ���� �� ����� � ��� �� �� "� ����� ������� ���� �� ���'�� � �� � ������� �� �� ��� �� �� ��� ��������� ���� ���

' ��������������

��� ������ ��� � �!� � ��! /���� #�����!���� ��� ����� ������ �� ������� ?����8� ��� ��� �� ��� ������ � � ��� � ������ ��� ������ �� ���� ���!�� �������� 9I6 �� �� ��� ��������� ��� ��� � ������� ���� ��� �������� �������� � 6�� �B���� ��� ���� �� ����� ������ �� ��� ������� ��������� ��� ���� �� ��� ������� �� ���������� ������� � � ��������� ������� ����� �� �� ��� .���9� ��������� ���� ���! ��� ����� � �������� ��9-@ ��� ��-�00)1%++ �� (9:C8�:� ������ 9%%%&G�%&�&�%,)1�

���������

)� E���� ��� A� 1�� ����� 7�����*�� ���#������� %���� ��'�� ��!���� �����#��������� 0� ������������� ������� ��!"#� ���� ���F����

A� 6���G� <� +���H� ��� I� :����� ����� )! ���"����� �� � � ��� ����!����� ��#����� �� �� ���"��������� ������������ ��������� :� ��� <�0"��"�":� ��%���� 6� �������� 5+7�

1� I���� J� 7������ ��� 6� ����� � ���/� $������ %�� �����#�������� ��� ������ �� � �������� ��� �������� ��� � $��������� /3(-��F-=��

E� ;������� 7� ���� ���'�� I� +������� ���$� I������� /..�� 5���� ������ ��%��������%�� ��� ����� �����#��������� 0� ����������� ��%&�%&' �(�

����� '����� ������ ��%������� �K����'�� ������"����� �� � �� #���� �� � '����� � ����L� ��%��"������

6� ;�7���� � A� 7������� ��� A� +������ /..�� 6��"��#�������� ���� ��� '��# ������ ����� �������"����� ��8����� ����������� ��%�������� 0� ������������ �� %&�%&' �(�

:� ;������� ��� 6� ;����'��� ����� $� ��������������� %�� ���������� ����� ������ ��� ���� 0������������ �� � !""� ���� -3�F-33�

I� $� ;������ ����� 1���2��( $ ��!���� ����#����������������� �� � �)� =������

�� +������� ��� :� E����� ����� J������� ������� ����� �����#��������� 0� ����������� �� �*����� ������� ���������� �� ��+���� ������������� ���� �..F�.��

+� :������ ���@� ����������� ��%������ ��� ����� ���"��#��������� 0� ����������� �� � �� %���&,-������ �� .������ .�/ �� ��/���� %��������� ���� �/F�@�

I� :����� A� $�������� ��� )� $������ ���@� 7��#��"��� ���� ��'���� ��!���� �������� ������� %����� ����� �����#��������� 0� ����������� �� ��!"0� ���� -�F���

$� :�'������� $� $������ 9� E�������� E� ;���������� 2� 7��������� /...� 0���1���2��( � ������������� ����#��� %�� 0������� 0� ����������� ���1&��(222� ���� @�=F@�.�

B� ������� ���-� +��#�#������� ���"�%"� ���� ���"���� ����� �������� ������ 0� ����������� ����������� �� ��� )���� �� �������� �����������

B� �������� ����� $�������� ��� ����� ��������"������� ����������� ����������� /-���(�@F�/-�

;� ���'����� ��� � 1����� /..�� ��� ����������� �%�������� ������� �� ��� ����� �����#�������������������� ����������� /@�=�(=/�F=-��

;� ������� ���=� 1��� ����� �����#�������� %��%���"��!� ����!��� ����� � �����'� �������� ���"���� 0� ����������� �� ��3) !"4�

B� '�� B�������� A� M�'���� ��� 1� 6��������� �����0� ��'��� ���� ���'�� �������� ������� # � �"��� ���#�������� 0� ����������� �� ������� ��!"#� ���� -��F-�@�

)� D�������� ���=� 5���� 1���2�� �� �����#��������� ������ %�� ��!� ������'��� 0� ����������� ��%���1 !"4� ���� �@�F��.�

6� ����� ��� :� 1���������� /...� ;������� �� ��'���� ��� ��������� ���� ��� # �������������������� 0� ����������� �� ���(222� ����/.@F/�3�

6� ����� � �� 7�������� :� 9������� 7� ����%������ :� 1���������� /..�� ��� A���� B� ������������� � ���� ������ ������ 0� ����������� ��%&�%&' �(�

6� ����� � ����� 5��� ��'���� ��� ����� �����"#�������� ��'����� �� ��'���� �������� ������������ �� � 44�� ����� )����� �� � ������������ ����������� ����������� ���� ���F��3�