Top Banner

of 43

Levene Loizou Incomplete Relations

Apr 07, 2018

Download

Documents

michealmact
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
  • 8/3/2019 Levene Loizou Incomplete Relations

    1/43

    D a t a b a s e D e s i g n f o r I n c o m p l e t e R e l a t i o n s

    M a r k L e v e n e

    U n i v e r s i t y C o l l e g e L o n d o n

    a n d

    G e o r g e L o i z o u

    B i r k b e c k C o l l e g e

    N a m e : M a r k L e v e n e

    A d d r e s s : G o w e r S t r e e t , L o n d o n W C 1 E 6 B T , U . K . , m l e v e n e @ c s . u c l . a c . u k

    A l i a t i o n : D e p a r t m e n t o f C o m p u t e r S c i e n c e , U n i v e r s i t y C o l l e g e L o n d o n , U n i v e r s i t y o f L o n d o n

    N a m e : G e o r g e L o i z o u

    A d d r e s s : M a l e t S t r e e t , L o n d o n W C 1 E 7 H X , U . K . , g e o r g e @ d c s . b b k . a c . u k

    A l i a t i o n : D e p a r t m e n t o f C o m p u t e r S c i e n c e , B i r k b e c k C o l l e g e , U n i v e r s i t y o f L o n d o n

    P e r m i s s i o n t o m a k e d i g i t a l o r h a r d c o p i e s o f p a r t o r a l l o f t h i s w o r k f o r p e r s o n a l o r c l a s s r o o m u s e i s

    g r a n t e d w i t h o u t f e e p r o v i d e d t h a t c o p i e s a r e n o t m a d e o r d i s t r i b u t e d f o r p r o t o r d i r e c t c o m m e r c i a l

    a d v a n t a g e a n d t h a t c o p i e s s h o w t h i s n o t i c e o n t h e r s t p a g e o r i n i t i a l s c r e e n o f a d i s p l a y a l o n g

    w i t h t h e f u l l c i t a t i o n . C o p y r i g h t s f o r c o m p o n e n t s o f t h i s w o r k o w n e d b y o t h e r s t h a n A C M m u s t

    b e h o n o r e d . A b s t r a c t i n g w i t h c r e d i t i s p e r m i t t e d . T o c o p y o t h e r w i s e , t o r e p u b l i s h , t o p o s t o n

    s e r v e r s , t o r e d i s t r i b u t e t o l i s t s , o r t o u s e a n y c o m p o n e n t o f t h i s w o r k i n o t h e r w o r k s , r e q u i r e s p r i o r

    s p e c i c p e r m i s s i o n a n d / o r a f e e . P e r m i s s i o n s m a y b e r e q u e s t e d f r o m P u b l i c a t i o n s D e p t , A C M

    I n c . , 1 5 1 5 B r o a d w a y , N e w Y o r k , N Y 1 0 0 3 6 U S A , f a x + 1 ( 2 1 2 ) 8 6 9 - 0 4 8 1 , o r p e r m i s s i o n s @ a c m . o r g

  • 8/3/2019 Levene Loizou Incomplete Relations

    2/43

    2 M . L e v e n e a n d G . L o i z o u

    A l t h o u g h t h e r e h a s b e e n a v a s t a m o u n t o f r e s e a r c h i n t h e a r e a o f r e l a t i o n a l d a t a b a s e d e s i g n , t o

    o u r k n o w l e d g e , t h e r e h a s b e e n v e r y l i t t l e w o r k t h a t c o n s i d e r s w h e t h e r t h i s t h e o r y i s s t i l l v a l i d

    w h e n r e l a t i o n s i n t h e d a t a b a s e m a y b e i n c o m p l e t e .

    W h e n r e l a t i o n s a r e i n c o m p l e t e a n d t h u s c o n t a i n n u l l v a l u e s t h e p r o b l e m o f w h e t h e r s a t i s f a c t i o n

    i s a d d i t i v e a r i s e s . A d d i t i v i t y i s t h e p r o p e r t y o f t h e e q u i v a l e n c e o f t h e s a t i s f a c t i o n o f a s e t o f

    f u n c t i o n a l d e p e n d e n c i e s ( F D s ) , F , w i t h t h e i n d i v i d u a l s a t i s f a c t i o n o f e a c h m e m b e r o f F i n a n i n -

    c o m p l e t e r e l a t i o n . I t i s w e l l k n o w n t h a t , i n g e n e r a l , s a t i s f a c t i o n o f F D s i s n o t a d d i t i v e . P r e v i o u s l y

    w e h a v e s h o w n t h a t s a t i s f a c t i o n i s a d d i t i v e i f a n d o n l y i f t h e s e t o f F D s i s m o n o d e p e n d e n t . A s e t

    o f F D s i s m o n o d e p e n d e n t i f i t s a t i s e s b o t h t h e i n t e r s e c t i o n p r o p e r t y a n d t h e s p l i t - f r e e n e s s p r o p -

    e r t y . ( T h e t w o d e n i n g p r o p e r t i e s o f m o n o d e p e n d e n t s e t s o f F D s c o r r e s p o n d t o t h e t w o d e n i n g

    p r o p e r t i e s o f c o n i c t - f r e e s e t s o f m u l t i v a l u e d d e p e n d e n c i e s . )

    W e c o n c l u d e t h a t m o n o d e p e n d e n c e i s a f u n d a m e n t a l d e s i r a b l e p r o p e r t y o f a s e t o f F D s w h e n

    c o n s i d e r i n g i n c o m p l e t e i n f o r m a t i o n i n r e l a t i o n a l d a t a b a s e d e s i g n . T h i s p r o v i d e s t h e m o t i v a t i o n

    f o r o u r i n v e s t i g a t i o n . W e n o w o u t l i n e t h e d e s i r a b l e p r o p e r t i e s t h a t m o n o d e p e n d e n t s e t s o f F D s

    p o s s e s s .

    W e s h o w t h a t w h e n t h e s e t o f F D s F e i t h e r s a t i s e s t h e i n t e r s e c t i o n p r o p e r t y o r t h e s p l i t - f r e e n e s s

    p r o p e r t y t h e n t h e p r o b l e m o f n d i n g a n o p t i m u m c o v e r o f F c a n b e s o l v e d i n p o l y n o m i a l t i m e i n

    t h e s i z e o f F ; i n g e n e r a l , t h i s p r o b l e m i s k n o w n t o b e N P - c o m p l e t e . W e a l s o s h o w t h a t w h e n F

    s a t i s e s t h e s p l i t - f r e e n e s s p r o p e r t y t h e n d e c i d i n g w h e t h e r t h e r e i s a s u p e r k e y o f c a r d i n a l i t y k o r

    l e s s c a n b e s o l v e d i n p o l y n o m i a l t i m e i n t h e s i z e o f F , s i n c e a l l t h e k e y s h a v e t h e s a m e c a r d i n a l i t y .

    I f F o n l y s a t i s e s t h e i n t e r s e c t i o n p r o p e r t y t h e n t h i s p r o b l e m i s N P - c o m p l e t e , a s i n t h e g e n e r a l

    c a s e . M o r e o v e r , w e s h o w t h a t w h e n F e i t h e r s a t i s e s t h e i n t e r s e c t i o n p r o p e r t y o r t h e s p l i t - f r e e n e s s

    p r o p e r t y t h e n d e c i d i n g w h e t h e r a n a t t r i b u t e i s p r i m e c a n b e s o l v e d i n p o l y n o m i a l t i m e i n t h e s i z e

    o f F ; i n g e n e r a l , t h i s p r o b l e m i s k n o w n t o b e N P - c o m p l e t e .

    A s s u m e t h a t a r e l a t i o n s c h e m a R i s i n a n a p p r o p r i a t e n o r m a l f o r m w i t h r e s p e c t t o a s e t o f F D s

    F . W e s h o w t h a t w h e n F s a t i s e s t h e i n t e r s e c t i o n p r o p e r t y t h e n t h e n o t i o n s o f S e c o n d N o r m a l

    F o r m a n d T h i r d N o r m a l F o r m a r e e q u i v a l e n t . W e a l s o s h o w t h a t w h e n R i s i n B o y c e - C o d d N o r m a l

    F o r m ( B C N F ) , t h e n F i s m o n o d e p e n d e n t i f a n d o n l y i f e i t h e r t h e r e i s a u n i q u e k e y f o r R , o r f o r

    a l l k e y s X f o r R , t h e c a r d i n a l i t y o f X i s o n e l e s s t h a n t h e n u m b e r o f a t t r i b u t e s a s s o c i a t e d w i t h R .

    F i n a l l y , w e t a c k l e a l o n g s t a n d i n g p r o b l e m i n r e l a t i o n a l d a t a b a s e t h e o r y b y s h o w i n g t h a t w h e n

    a s e t o f F D s F o v e r R s a t i s e s t h e i n t e r s e c t i o n p r o p e r t y , t h e n i t a l s o s a t i s e s t h e s p l i t - f r e e n e s s

    p r o p e r t y , i . e . i s m o n o d e p e n d e n t , i f a n d o n l y i f e v e r y l o s s l e s s j o i n d e c o m p o s i t i o n o f R w i t h r e -

    s p e c t t o F i s a l s o d e p e n d e n c y p r e s e r v i n g . A s a c o r o l l a r y o f t h i s r e s u l t w e a r e a b l e t o s h o w t h a t

    w h e n F s a t i s e s t h e i n t e r s e c t i o n p r o p e r t y , t h e n i t a l s o s a t i s e s t h e s p l i t - f r e e n e s s p r o p e r t y , i . e . i s

    m o n o d e p e n d e n t , i f a n d o n l y i f e v e r y l o s s l e s s j o i n d e c o m p o s i t i o n o f R , w h i c h i s i n B C N F , i s a l s o

    d e p e n d e n c y p r e s e r v i n g . A l o s s l e s s j o i n d e c o m p o s i t i o n o f R , w h i c h i s i n B C N F , i s s a i d t o b e o p t i -

    m u m i f i t h a s t h e s m a l l e s t p o s s i b l e s i z e . O u r n a l r e s u l t i s t h a t w h e n F i s m o n o d e p e n d e n t t h e n

    t h e r e e x i s t s a u n i q u e o p t i m u m l o s s l e s s j o i n d e c o m p o s i t i o n o f R , w h i c h i s i n B C N F , a n d i s a l s o

    d e p e n d e n c y p r e s e r v i n g . F u r t h e r m o r e , t h i s u l t i m a t e d e c o m p o s i t i o n c a n b e a t t a i n e d i n p o l y n o m i a l

    t i m e i n t h e s i z e o f F . F r o m t h e d a t a b a s e d e s i g n e r ' s p o i n t o f v i e w t h i s i s t h e i d e a l s i t u a t i o n .

    C a t e g o r i e s a n d S u b j e c t D e s c r i p t o r s : H . 2 . 1 D a t a b a s e M a n a g e m e n t ] : L o g i c a l D e s i g n | d a t a

    m o d e l s ; n o r m a l f o r m s

    G e n e r a l T e r m s : D e s i g n , T h e o r y , C o m p l e x i t y

    A d d i t i o n a l K e y W o r d s a n d P h r a s e s : I n c o m p l e t e i n f o r m a t i o n , n u l l f u n c t i o n a l d e p e n d e n c i e s , a d -

    d i t i v i t y p r o b l e m , m o n o d e p e n d e n c e , i n t e r s e c t i o n p r o p e r t y , s p l i t - f r e e n e s s p r o p e r t y , o p t i m u m c o v e r ,

    p r i m e a t t r i b u t e p r o b l e m , s u p e r k e y o f c a r d i n a l i t y k p r o b l e m , n o r m a l f o r m s , l o s s l e s s j o i n d e c o m p o -

    s i t i o n , d e p e n d e n c y p r e s e r v i n g d e c o m p o s i t i o n

  • 8/3/2019 Levene Loizou Incomplete Relations

    3/43

    D a t a b a s e D e s i g n f o r I n c o m p l e t e R e l a t i o n s 3

    1 . I N T R O D U C T I O N

    R e l a t i o n a l d a t a b a s e d e s i g n i s a v e r y i m p o r t a n t b r a n c h o f r e l a t i o n a l d a t a b a s e t h e o r y

    a n d i s e x t e n s i v e l y c o v e r e d i n m o s t d a t a b a s e t e x t b o o k s U l l m a n 1 9 8 8 ; M a n n i l a a n d

    R a i h a 1 9 9 2 ; A t z e n i a n d D e A n t o n e l l i s 1 9 9 3 ; D a t e 1 9 9 5 ] . O n e o f t h e m a i n a i m s o f

    r e l a t i o n a l d a t a b a s e d e s i g n i s t o n o r m a l i s e a n i n p u t r e l a t i o n s c h e m a t o g e t h e r w i t h

    a s e t o f d a t a d e p e n d e n c i e s i n t o a n a p p r o p r i a t e n o r m a l f o r m . T h e m o t i v a t i o n b e -

    h i n d t h e v a r i o u s n o r m a l f o r m s i s t o r e m o v e t h e p r o b l e m s t h a t a r e c a u s e d b y t h e

    i n f a m o u s u p d a t e a n o m a l i e s a n d r e d u n d a n c y p r o b l e m s C o d d 1 9 7 2 ; V i n c e n t 1 9 9 4 ] .

    W h e n t h e i n p u t s e t o f d a t a d e p e n d e n c i e s i s a s e t o f F u n c t i o n a l D e p e n d e n c i e s ( o r

    s i m p l y F D s ) a n a p p r o p r i a t e n o r m a l f o r m m a y b e S e c o n d T h i r d o r B o y c e - C o d d

    N o r m a l F o r m ( a b b r e v i a t e d t o 2 N F , 3 N F a n d B C N F , r e s p e c t i v e l y ) . A s a r e s u l t o f

    n o r m a l i s a t i o n w e o b t a i n a c o l l e c t i o n o f r e l a t i o n s c h e m a s , c a l l e d a d e c o m p o s i t i o n

    W i t h e a c h r e l a t i o n s c h e m a i n t h e d e c o m p o s i t i o n w e a s s o c i a t e t h e p r o j e c t i o n o f t h e

    i n p u t s e t o f F D s o n t o t h e r e l a t i o n s c h e m a . T w o d e s i r a b l e p r o p e r t i e s o f d e c o m p o s i -

    t i o n s a r e t h a t t h e y p o s s e s s t h e l o s s l e s s j o i n p r o p e r t y ( o r s i m p l y a r e l o s s l e s s ) A h o

    e t a l . 1 9 7 9 ] a n d t h a t t h e y b e d e p e n d e n c y p r e s e r v i n g B e e r i a n d H o n e y m a n 1 9 8 1 ]

    ( s e e a l s o R i s s a n e n 1 9 7 7 ; V a r d i 1 9 8 2 ] ) . A l t h o u g h i t i s a l w a y s p o s s i b l e t o o b t a i n a

    d e c o m p o s i t i o n w h i c h i s i n 2 N F , 3 N F o r B C N F , a n d i s a l s o l o s s l e s s , i t i s n o t a l w a y s

    p o s s i b l e t o a c h i e v e a d e c o m p o s i t i o n w h i c h i s i n B C N F , a n d i s a l s o b o t h l o s s l e s s a n d

    d e p e n d e n c y p r e s e r v i n g B e e r i a n d B e r n s t e i n 1 9 7 9 ; O s b o r n 1 9 7 9 ] .

    D e s p i t e t h e v a s t a m o u n t o f r e s e a r c h i n t h e a r e a o f r e l a t i o n a l d a t a b a s e d e s i g n , t o

    o u r k n o w l e d g e , t h e r e h a s b e e n v e r y l i t t l e w o r k t h a t c o n s i d e r s w h e t h e r t h i s t h e o r y i s

    s t i l l v a l i d w h e n t h e r e l a t i o n s i n t h e d a t a b a s e m a y b e i n c o m p l e t e . T h i s p r o v i d e s t h e

    m o t i v a t i o n f o r t h e c u r r e n t p a p e r . B e f o r e o u t l i n i n g o u r r e s u l t s w e b r i e y d e s c r i b e

    t h e u n d e r l y i n g m o d e l o f i n c o m p l e t e i n f o r m a t i o n t h a t w e u s e h e r e i n . ( A d e t a i l e d

    a c c o u n t c a n b e f o u n d i n L e v e n e a n d L o i z o u 1 9 9 7 ; L e v e n e a n d L o i z o u 1 9 9 8 ] ; f o r

    a l t e r n a t i v e t r e a t m e n t s t o d e a l i n g w i t h i n c o m p l e t e i n f o r m a t i o n w e r e f e r t h e r e a d e r

    t o C h a p t e r 5 i n L e v e n e a n d L o i z o u 1 9 9 9 ] ) .

    W e f o l l o w C o d d ' s s u g g e s t i o n C o d d 1 9 7 9 ] o f a d d i n g a n u n m a r k e d n u l l v a l u e ,

    d e n o t e d b y u n k , t o t h e u n d e r l y i n g d a t a b a s e d o m a i n s , w h o s e m e a n i n g i s \ v a l u e a t

    p r e s e n t e x i s t s b u t i s u n k n o w n " . W e c a l l a r e l a t i o n w h o s e t u p l e s m a y c o n t a i n t h e

    n u l l v a l u e u n k a n i n c o m p l e t e r e l a t i o n . T h e s e m a n t i c s o f a n i n c o m p l e t e r e l a t i o n r

    a r e d e n e d i n t e r m s o f t h e p o s s i b l e w o r l d s r e l a t i v e t o r ; w e d e n o t e t h i s s e t o f p o s s i b l e

    w o r l d s b y P O S S ( r ) . E a c h p o s s i b l e w o r l d i n P O S S ( r ) i s a c o m p l e t e r e l a t i o n , i . e . a

    r e l a t i o n w i t h o u t a n y o c c u r r e n c e o f u n k , e m a n a t i n g f r o m a p o s s i b l e s u b s t i t u t i o n

    o f a l l t h e o c c u r r e n c e s o f u n k i n r b y n o n n u l l v a l u e s i n t h e u n d e r l y i n g d a t a b a s e

    d o m a i n s .

    F D s a r e b y f a r t h e m o s t c o m m o n i n t e g r i t y c o n s t r a i n t i n t h e r e a l w o r l d U l l m a n

    1 9 8 8 ; M a n n i l a a n d R a i h a 1 9 9 2 ; A t z e n i a n d D e A n t o n e l l i s 1 9 9 3 ] a n d t h e n o t i o n o f a

    k e y ( d e r i v e d f r o m a g i v e n s e t o f F D s ) C o d d 1 9 7 9 ] i s f u n d a m e n t a l t o t h e r e l a t i o n a l

    m o d e l . G i v e n a s e t o f F D s F o v e r a r e l a t i o n s c h e m a R a n d a n i n c o m p l e t e r e l a t i o n

    r o v e r R w e s a y t h a t r s a t i s e s a n F D X ! Y , d e n o t e d b y r = X ! Y , i f t h e r e i s

    s o m e c o m p l e t e r e l a t i o n s 2 P O S S ( r ) t h a t s a t i s e s X ! Y i n t h e s t a n d a r d m a n n e r

    U l l m a n 1 9 8 8 ; M a n n i l a a n d R a i h a 1 9 9 2 ; A t z e n i a n d D e A n t o n e l l i s 1 9 9 3 ] ; w e d e n o t e

    t h i s s a t i s f a c t i o n b y s = X ! Y . O n e x t e n d i n g t h e d e n i t i o n o f s a t i s f a c t i o n t o a s e t

    o f F D s , i t i s t h e r e f o r e n a t u r a l t o s a y t h a t r s a t i s e s F , d e n o t e d b y r = F , i f t h e r e

  • 8/3/2019 Levene Loizou Incomplete Relations

    4/43

    4 M . L e v e n e a n d G . L o i z o u

    i s s o m e c o m p l e t e r e l a t i o n s 2 P O S S ( s ) , s u c h t h a t f o r a l l F D s X ! Y i n F , s = X

    ! Y

    T h i s g i v e s r i s e t o t h e a d d i t i v i t y p r o b l e m , w h i c h i s t h e p r o b l e m o f w h e t h e r t h e

    s t a t e m e n t t h a t r = F i s e q u i v a l e n t t o t h e s t a t e m e n t t h a t f o r a l l F D s X ! Y i n a

    r e d u c e d c o v e r G o f F B e e r i a n d B e r n s t e i n 1 9 7 9 ] r = X ! Y L e v e n e a n d L o i z o u

    1 9 9 7 ; L e v e n e a n d L o i z o u 1 9 9 8 ] ( c f . A t z e n i a n d D e A n t o n e l l i s 1 9 9 3 ] ) . ( E x a m p l e 1

    s h o w s w h y w e d e n e r = F i n t e r m s o f a r e d u c e d c o v e r o f F . ) I f t h e s e t w o s t a t e m e n t s

    a r e e q u i v a l e n t f o r a c l a s s o f i n c o m p l e t e r e l a t i o n s a n d a c l a s s o f s e t s o f F D s t h e n

    w e s a y t h a t s a t i s f a c t i o n i s a d d i t i v e w i t h r e s p e c t t o t h e s e c l a s s e s . I f s a t i s f a c t i o n

    i s n o t a d d i t i v e , t h e n a s e t o f F D s F , i n t h i s n o n a d d i t i v e c l a s s , m a y b e v i e w e d a s

    c o n t r a d i c t o r y . T h u s w e c o n s i d e r t h e s o l u t i o n o f t h e a d d i t i v i t y p r o b l e m t o b e a n

    i m p o r t a n t p r e r e q u i s i t e f o r a n y r e l a t i o n a l d a t a b a s e s y s t e m s u p p o r t i n g F D s i n t h e

    c o n t e x t o f i n c o m p l e t e i n f o r m a t i o n , s i n c e o t h e r w i s e s e m a n t i c a n o m a l i e s m a y a r i s e .

    I t i s w e l l k n o w n t h a t , i n g e n e r a l , s a t i s f a c t i o n o f F D s i s n o t a d d i t i v e A t z e n i a n d

    M o r f u n i 1 9 8 6 ; L e v e n e a n d L o i z o u 1 9 9 7 ; L e v e n e a n d L o i z o u 1 9 9 8 ] . F o r e x a m p l e ,

    t h e i n c o m p l e t e r e l a t i o n r

    1

    A t z e n i a n d M o r f u n i 1 9 8 6 ] s h o w n i n T a b l e 1 i s s u c h t h a t

    r

    1

    = A ! B a n d r

    1

    = B ! C b u t r

    1

    6 = f A ! B B ! C g . T h i s i s d u e t o t h e

    f a c t t h a t 8 s

    1

    2 P O S S ( r

    1

    ) s

    1

    6 = A ! C , w h i c h i s i n f e r r e d f r o m A ! B a n d B !

    C b y t h e t r a n s i t i v i t y r u l e o f A r m s t r o n g ' s a x i o m s y s t e m A r m s t r o n g 1 9 7 4 ; U l l m a n

    1 9 8 8 ; M a n n i l a a n d R a i h a 1 9 9 2 ; A t z e n i a n d D e A n t o n e l l i s 1 9 9 3 ] . A n o t h e r e x a m p l e

    i s t h e i n c o m p l e t e r e l a t i o n r

    2

    s h o w n i n T a b l e 2 , w h e r e r

    2

    = A ! C a n d r

    2

    = B !

    C , b u t r

    2

    6 = f A ! C B ! C g . T h i s i s d u e t o t h e f a c t t h a t 8 s

    2

    2 P O S S ( r

    2

    ) , t h e

    C - v a l u e o f t h e s e c o n d t u p l e i s e i t h e r 1 o r 0 a n d t h e r e f o r e e i t h e r s

    2

    6 = A ! C o r s

    2

    6 = B ! C . I n t h i s c a s e t w o i n c o m p a r a b l e s e t s o f a t t r i b u t e s , A a n d B , f u n c t i o n a l l y

    d e t e r m i n e a c o m m o n a t t r i b u t e C . I t i s a n i n t e r e s t i n g f a c t t h a t i t i s a l s o t h e c a s e

    t h a t r

    2

    6 = f A ! B B ! C g a n d t h u s t h e s e c o n d r e l a t i o n i s a l s o a c o u n t e r e x a m p l e

    t o t h e r s t s e t o f F D s .

    A B C

    0 u n k 0

    0 u n k 1

    T a b l e 1 . T h e c o u n t e r e x a m p l e r e l a t i o n r

    1

    A B C

    0 u n k 0

    0 0 u n k

    u n k 0 1

    T a b l e 2 . T h e c o u n t e r e x a m p l e r e l a t i o n r

    2

    I n L e v e n e a n d L o i z o u 1 9 9 7 ] w e i n t r o d u c e d t h e c l a s s o f m o n o d e p e n d e n t s e t s o f

    F D s . A s e t o f F D s F o v e r a r e l a t i o n s c h e m a R i s m o n o d e p e n d e n t i f t h e f o l l o w i n g

    t w o p r o p e r t i e s a r e s a t i s e d . T h e r s t p r o p e r t y , c a l l e d t h e i n t e r s e c t i o n p r o p e r t y

    i n f o r m a l l y s t a t e s t h a t f o r e a c h a t t r i b u t e A i n t h e a t t r i b u t e s e t a s s o c i a t e d w i t h R

    t h e r e i s a u n i q u e n o n t r i v i a l a n d r e d u c e d F D i n t h e c l o s u r e o f F t h a t f u n c t i o n a l l y

    d e t e r m i n e s A . T h e s e c o n d p r o p e r t y , c a l l e d t h e s p l i t - f r e e n e s s p r o p e r t y , i n f o r m a l l y

    s t a t e s t h a t t h e r e a r e n o t w o n o n t r i v i a l F D s i n t h e c l o s u r e o f F s u c h t h a t t h e r i g h t -

    h a n d s i d e o f e a c h o f t h e t w o F D s s p l i t s t h e l e f t - h a n d s i d e o f t h e o t h e r F D . ( T h e

    t w o d e n i n g p r o p e r t i e s o f m o n o d e p e n d e n t s e t s o f F D s c o r r e s p o n d t o t h e t w o d e n -

    i n g p r o p e r t i e s o f c o n i c t - f r e e s e t s o f M u l t i v a l u e d D e p e n d e n c i e s ( o r s i m p l y M V D s )

    S c i o r e 1 9 8 1 ; L i e n 1 9 8 2 ; B e e r i e t a l . 1 9 8 3 ; B e e r i a n d K i f e r 1 9 8 6 ] ; i n S e c t i o n 4 w e

    e x h i b i t a s i m p l e e x a m p l e s h o w i n g t h a t , i n g e n e r a l , m o n o d e p e n d e n c e d o e s n o t i m p l y

  • 8/3/2019 Levene Loizou Incomplete Relations

    5/43

    D a t a b a s e D e s i g n f o r I n c o m p l e t e R e l a t i o n s 5

    c o n i c t - f r e e n e s s . ) T h e m a i n r e s u l t i n L e v e n e a n d L o i z o u 1 9 9 7 ] s h o w s t h a t s a t i s -

    f a c t i o n i s a d d i t i v e w i t h r e s p e c t t o t h e c l a s s o f a l l i n c o m p l e t e r e l a t i o n s a n d a c l a s s

    o f s e t s o f F D s F C , i f a n d o n l y i f a l l t h e s e t s o f F D s i n F C a r e m o n o d e p e n d e n t s e t s

    o f F D s . T h e r e f o r e , m o n o d e p e n d e n c e p r o v i d e s a s o l u t i o n t o t h e a d d i t i v i t y p r o b l e m .

    W e c o n c l u d e t h a t m o n o d e p e n d e n c e i s a f u n d a m e n t a l l y d e s i r a b l e p r o p e r t y o f a

    s e t o f F D s w h e n c o n s i d e r i n g i n c o m p l e t e i n f o r m a t i o n i n r e l a t i o n a l d a t a b a s e d e s i g n .

    T h e r e f o r e t h e s t a r t i n g p o i n t o f o u r i n v e s t i g a t i o n i s t o a s s u m e t h a t w e a r e g i v e n

    a m o n o d e p e n d e n t s e t o f F D s F o v e r a r e l a t i o n s c h e m a R . W e n e x t o u t l i n e t h e

    d e s i r a b l e p r o p e r t i e s t h a t m o n o d e p e n d e n t s e t s o f F D s p o s s e s s .

    I n t h e p r o c e s s o f d a t a b a s e d e s i g n i t i s c o m m o n t o u s e a c o v e r o f a s e t o f F D s F

    o v e r a r e l a t i o n s c h e m a R t h a t r e p r e s e n t s t h e F D s i n F i n a s u c c i n c t m a n n e r M a i e r

    1 9 8 0 ; M a n n i l a a n d R a i h a 1 9 8 3 ] . I d e a l l y w e w o u l d l i k e t o u s e a n o p t i m u m c o v e r o f

    F , i . e . a c o v e r o f F w i t h t h e s m a l l e s t p o s s i b l e s i z e , b u t t h e p r o b l e m o f n d i n g a n

    o p t i m u m c o v e r o f a s e t o f F D s i s , i n g e n e r a l , N P - c o m p l e t e M a i e r 1 9 8 0 ] . O n t h e

    o t h e r h a n d , a n L R - m i n i m u m c o v e r o f F , i . e . a c o v e r o f F w i t h t h e s m a l l e s t p o s s i b l e

    c a r d i n a l i t y a n d s u c h t h a t t h e l e f t - h a n d s i d e s a n d r i g h t - h a n d s i d e s o f t h e F D s i n

    t h e c o v e r a r e m i n i m a l , c a n b e o b t a i n e d i n p o l y n o m i a l t i m e i n t h e s i z e o f F M a i e r

    1 9 8 0 ] . ( W e c a l l a n L R - m i n i m u m c o v e r o f F s i m p l y a m i n i m u m c o v e r o f F . )

    W e s h o w t h a t w h e n F s a t i s e s t h e i n t e r s e c t i o n p r o p e r t y t h e n a m i n i m u m c o v e r

    o f F i s a l s o a n o p t i m u m c o v e r o f F . I t f o l l o w s t h a t t h e o p t i m u m c o v e r o f F c a n

    b e c o m p u t e d i n p o l y n o m i a l t i m e i n t h e s i z e o f F . I n a d d i t i o n , w e s h o w t h a t t h e

    o p t i m u m c o v e r i s u n i q u e , t h a t i t c a n h a v e a t m o s t n F D s , a n d t h a t i t s s i z e c a n

    b e n o m o r e t h a n n

    2

    , w h e r e n i s t h e c a r d i n a l i t y o f t h e a t t r i b u t e s e t o f R . W e a l s o

    s h o w t h a t w h e n F s a t i s e s t h e s p l i t - f r e e n e s s p r o p e r t y t h e n a m i n i m u m c o v e r h a s

    o p t i m u m l e f t - h a n d s i d e s a n d a n o p t i m u m c o v e r o f F c a n b e o b t a i n e d i n p o l y n o m i a l

    t i m e , a l t h o u g h i t i s n o t u n i q u e .

    A n i m p o r t a n t p r o b l e m i n d a t a b a s e d e s i g n i s t h a t o f d e c i d i n g w h e t h e r t h e r e i s a

    s u p e r k e y f o r R w i t h r e s p e c t t o F o f c a r d i n a l i t y k o r l e s s . T h i s p r o b l e m , k n o w n a s

    t h e s u p e r k e y o f c a r d i n a l i t y k p r o b l e m , w a s s h o w n t o b e N P - c o m p l e t e i n L u c c h e s i

    a n d O s b o r n 1 9 7 8 ] . W e s h o w t h a t w h e n F s a t i s e s o n l y t h e i n t e r s e c t i o n p r o p e r t y

    t h e n t h i s p r o b l e m r e m a i n s N P - c o m p l e t e . O n t h e o t h e r h a n d , w h e n F s a t i s e s t h e

    s p l i t - f r e e n e s s p r o p e r t y t h e n t h i s p r o b l e m c a n b e s o l v e d i n p o l y n o m i a l t i m e i n t h e

    s i z e o f F . I n f a c t , i n t h i s c a s e a l l t h e k e y s f o r R w i t h r e s p e c t t o F h a v e t h e s a m e

    c a r d i n a l i t y a n d t h u s t h e p r o b l e m r e d u c e s t o t h a t o f n d i n g a s i n g l e k e y f o r R , w h i c h

    c a n e a s i l y b e f o u n d i n p o l y n o m i a l t i m e i n t h e s i z e o f F ( s e e A l g o r i t h m 3 . 3 . i n A t z e n i

    a n d D e A n t o n e l l i s 1 9 9 3 ] a n d K u n d u 1 9 8 5 ] ) . A r e l a t e d p r o b l e m i n d a t a b a s e d e s i g n

    i s t h a t o f d e c i d i n g w h e t h e r a n a t t r i b u t e i s p r i m e w i t h r e s p e c t t o F , i . e . w h e t h e r

    a n a t t r i b u t e b e l o n g s t o a t l e a s t o n e k e y f o r R . T h i s p r o b l e m , k n o w n a s t h e p r i m e

    a t t r i b u t e p r o b l e m , i s a l s o , i n g e n e r a l , N P - c o m p l e t e L u c c h e s i a n d O s b o r n 1 9 7 8 ] .

    W e s h o w t h a t w h e n F e i t h e r s a t i s e s t h e i n t e r s e c t i o n p r o p e r t y o r t h e s p l i t - f r e e n e s s

    p r o p e r t y t h e n t h i s p r o b l e m c a n b e s o l v e d i n p o l y n o m i a l t i m e i n t h e s i z e o f F .

    A s s u m e t h a t R i s i n a n a p p r o p r i a t e n o r m a l f o r m w i t h r e s p e c t t o F . W e s h o w

    t h a t w h e n F s a t i s e s t h e i n t e r s e c t i o n p r o p e r t y t h e n t h e n o t i o n s o f 2 N F a n d 3 N F

    a r e e q u i v a l e n t . I n f a c t , w e s h o w t h a t i n t h i s c a s e i f t h e n u m b e r o f k e y s f o r R i s

    g r e a t e r t h a n o n e t h e n a l l t h e a t t r i b u t e s a s s o c i a t e d w i t h R a r e p r i m e . I n t h e s p e c i a l

    c a s e s w h e n t h e r e i s a u n i q u e k e y f o r R w i t h r e s p e c t t o F , o r a l l t h e k e y s f o r R

  • 8/3/2019 Levene Loizou Incomplete Relations

    6/43

    6 M . L e v e n e a n d G . L o i z o u

    a r e s i m p l e , i . e . t h e i r c a r d i n a l i t y i s o n e , w e s h o w t h a t t h e n o t i o n s o f 2 N F , 3 N F

    a n d B C N F a r e a l l e q u i v a l e n t . W e a l s o s h o w t h a t w h e n R i s i n B C N F , t h e n F i s

    m o n o d e p e n d e n t i f a n d o n l y i f e i t h e r F h a s a u n i q u e k e y f o r R , o r f o r a l l k e y s X f o r

    R , t h e c a r d i n a l i t y o f X i s o n e l e s s t h a n t h e n u m b e r o f a t t r i b u t e s a s s o c i a t e d w i t h R .

    O u r n e x t r e s u l t t a c k l e s a l o n g s t a n d i n g p r o b l e m i n r e l a t i o n a l d a t a b a s e t h e o r y .

    W e s h o w t h a t w h e n F o v e r R s a t i s e s t h e i n t e r s e c t i o n p r o p e r t y , t h e n i t a l s o s a t i s e s

    t h e s p l i t - f r e e n e s s p r o p e r t y , i . e . i s m o n o d e p e n d e n t , i f a n d o n l y i f e v e r y l o s s l e s s j o i n

    d e c o m p o s i t i o n o f R w i t h r e s p e c t t o F i s a l s o d e p e n d e n c y p r e s e r v i n g . T h i s r e s u l t i s

    s i g n i c a n t i n d a t a b a s e d e s i g n , s i n c e a s s u m i n g t h a t F i s m o n o d e p e n d e n t , t h e u s e r s

    n e e d o n l y c o n c e r n t h e m s e l v e s w i t h a t t a i n i n g a d e c o m p o s i t i o n w h i c h i s l o s s l e s s .

    D e p e n d e n c y p r e s e r v a t i o n c o m e s a s a b y - p r o d u c t o f F b e i n g m o n o d e p e n d e n t . A s a

    c o r o l l a r y o f t h i s r e s u l t w e a r e a b l e t o s h o w t h a t w h e n F s a t i s e s t h e i n t e r s e c t i o n

    p r o p e r t y , t h e n i t a l s o s a t i s e s t h e s p l i t - f r e e n e s s p r o p e r t y , i . e . i s m o n o d e p e n d e n t ,

    i f a n d o n l y i f e v e r y l o s s l e s s j o i n d e c o m p o s i t i o n o f R , w h i c h i s i n B C N F , i s a l s o

    d e p e n d e n c y p r e s e r v i n g .

    A l o s s l e s s j o i n d e c o m p o s i t i o n o f R , w h i c h i s i n B C N F , i s s a i d t o b e o p t i m u m i f

    i t h a s t h e s m a l l e s t p o s s i b l e s i z e . O u r n a l r e s u l t i s t h a t t h e r e i s a u n i q u e o p t i m u m

    l o s s l e s s j o i n d e c o m p o s i t i o n o f R , w h i c h i s i n B C N F , a n d i s a l s o d e p e n d e n c y p r e -

    s e r v i n g . F u r t h e r m o r e , t h i s u l t i m a t e d e c o m p o s i t i o n c a n b e a t t a i n e d i n p o l y n o m i a l

    t i m e i n t h e s i z e o f F . F r o m t h e d a t a b a s e d e s i g n e r ' s p o i n t o f v i e w t h i s i s t h e i d e a l

    s i t u a t i o n .

    D u e t o t h e m a n y d e s i r a b l e p r o p e r t i e s o f m o n o d e p e n d e n t s e t s o f F D s i n t h e c o n t e x t

    o f r e l a t i o n a l d a t a b a s e d e s i g n , o u r r e s u l t s a r e r e l e v a n t w h e t h e r w e a l l o w i n c o m p l e t e

    r e l a t i o n s i n t h e d a t a b a s e o r n o t . O u r r e s u l t s s h o w a n i n t e r e s t i n g c o r r e s p o n d e n c e

    b e t w e e n m o n o d e p e n d e n c e a s a d e s i r a b l e p r o p e r t y , w h e n t h e d a t a d e p e n d e n c i e s a r e

    F D s , a n d c o n i c t - f r e e n e s s a s a d e s i r a b l e p r o p e r t y , w h e n t h e d a t a d e p e n d e n c i e s a r e

    M V D s S c i o r e 1 9 8 1 ; L i e n 1 9 8 2 ; B e e r i e t a l . 1 9 8 3 ; B e e r i a n d K i f e r 1 9 8 6 ] .

    T h e l a y o u t o f t h e r e s t o f t h e p a p e r i s a s f o l l o w s . I n S e c t i o n 2 w e f o r m a l i s e t h e

    n o t i o n o f i n c o m p l e t e r e l a t i o n s . I n S e c t i o n 3 w e d e n e t h e n o t i o n o f a n F D b e i n g

    s a t i s e d i n a n i n c o m p l e t e r e l a t i o n . I n S e c t i o n 4 w e i n t r o d u c e m o n o d e p e n d e n t s e t s

    o f F D s . I n S e c t i o n 5 w e d i s c u s s t h e a d d i t i v i t y p r o b l e m a n d s t a t e t h e t h e o r e m t h a t

    s h o w s t h a t m o n o d e p e n d e n t s e t s o f F D s s o l v e t h i s p r o b l e m . I n S e c t i o n 6 w e s h o w

    t h a t n d i n g a n o p t i m u m c o v e r o f a s e t o f F D s t h a t e i t h e r s a t i s e s t h e i n t e r s e c t i o n

    p r o p e r t y o r t h e s p l i t - f r e e n e s s p r o p e r t y c a n b e d o n e i n p o l y n o m i a l t i m e . I n S u b s e c -

    t i o n 6 . 1 w e s h o w t h a t w h e n F s a t i s e s t h e i n t e r s e c t i o n p r o p e r t y a n d i s m i n i m u m

    t h e n i t i s a l s o o p t i m u m a n d , i n a d d i t i o n , t h i s o p t i m u m c o v e r i s u n i q u e . I n S u b s e c -

    t i o n 6 . 2 w e s h o w t h a t w h e n F s a t i s e s t h e s p l i t - f r e e n e s s p r o p e r t y a n d i s m i n i m u m

    t h e n i t h a s o p t i m u m l e f t - h a n d s i d e s . I n S u b s e c t i o n 6 . 3 w e g i v e s o m e t e c h n i c a l

    l e m m a s c o n c e r n i n g t h e s t r u c t u r e o f m o n o d e p e n d e n t s e t s o f F D s , w h i c h a r e u s e d i n

    t h e r e m a i n i n g s e c t i o n s . I n S e c t i o n 7 w e i n v e s t i g a t e t h e s t r u c t u r e o f t h e s e t o f k e y s

    f o r R , w h e n F i s m o n o d e p e n d e n t . I n S u b s e c t i o n 7 . 1 w e s h o w t h a t t h e s u p e r k e y o f

    c a r d i n a l i t y k p r o b l e m r e m a i n s N P - c o m p l e t e w h e n F s a t i s e s o n l y t h e i n t e r s e c t i o n

    p r o p e r t y b u t c a n b e s o l v e d i n p o l y n o m i a l t i m e w h e n F s a t i s e s t h e s p l i t - f r e e n e s s

    p r o p e r t y . I n S u b s e c t i o n 7 . 2 w e s h o w t h a t t h e p r i m e a t t r i b u t e p r o b l e m c a n b e

    s o l v e d i n p o l y n o m i a l t i m e i n t h e s i z e o f F w h e n F e i t h e r s a t i s e s t h e i n t e r s e c t i o n

    p r o p e r t y o r t h e s p l i t - f r e e n e s s p r o p e r t y . I n S e c t i o n 8 w e i n v e s t i g a t e t h e e e c t t h a t

  • 8/3/2019 Levene Loizou Incomplete Relations

    7/43

    D a t a b a s e D e s i g n f o r I n c o m p l e t e R e l a t i o n s 7

    m o n o d e p e n d e n c e h a s o n a r e l a t i o n s c h e m a w h i c h i s i n a p a r t i c u l a r n o r m a l f o r m .

    I n S e c t i o n 9 w e s h o w t h a t w h e n a s e t o f F D s F o v e r R s a t i s e s t h e i n t e r s e c t i o n

    p r o p e r t y , t h e n i t a l s o s a t i s e s t h e s p l i t - f r e e n e s s p r o p e r t y , i . e . i s m o n o d e p e n d e n t ,

    i f a n d o n l y i f e v e r y l o s s l e s s j o i n d e c o m p o s i t i o n o f R i s a l s o d e p e n d e n c y p r e s e r v i n g ,

    a n d s h o w t h a t a u n i q u e , o p t i m u m , l o s s l e s s j o i n d e c o m p o s i t i o n o f R , w h i c h i s i n

    B C N F , a n d i s a l s o d e p e n d e n c y p r e s e r v i n g c a n b e o b t a i n e d i n p o l y n o m i a l t i m e i n

    t h e s i z e o f F . F i n a l l y , i n S e c t i o n 1 0 w e g i v e o u r c o n c l u d i n g r e m a r k s .

    T a b l e 3 s u m m a r i s e s t h e m a i n c o m p l e x i t y r e s u l t s o b t a i n e d i n t h e p a p e r : F D d e -

    n o t e s t h e g e n e r a l c l a s s o f F D s , I P d e n o t e s t h e c l a s s o f F D s s a t i s f y i n g t h e i n t e r s e c -

    t i o n p r o p e r t y , S F d e n o t e s t h e c l a s s o f F D s s a t i s f y i n g t h e s p l i t - f r e e n e s s p r o p e r t y a n d

    M O N O d e n o t e s t h e c l a s s o f m o n o d e p e n d e n t F D s . N P C s t a n d s f o r N P - c o m p l e t e ,

    N P H s t a n d s f o r N P - h a r d , P s t a n d s f o r p o l y n o m i a l t i m e a n d \ ? " s t a n d s f o r n o t

    i n v e s t i g a t e d . T h e l e f t m o s t c o l u m n d e n o t e s t h e p r o b l e m c o n s i d e r e d .

    P r o b l e m / C l a s s F D I P S F M O N O

    O p t i m u m c o v e r N P C P P P

    S u p e r k e y o f c a r d i n a l i t y k N P C N P C P P

    P r i m e a t t r i b u t e N P C P P P

    3 N F N P C P P P

    O p t i m u m B C N F N P H ? ? P

    T a b l e 3 . S u m m a r y o f m a i n c o m p l e x i t y r e s u l t s

    2 . R E L A T I O N S T H A T M O D E L I N C O M P L E T E I N F O R M A T I O N

    I n t h i s s e c t i o n w e e x t e n d r e l a t i o n s c h e m a s a n d r e l a t i o n s s o a s t o m o d e l i n c o m p l e t e

    i n f o r m a t i o n .

    W e u s e t h e n o t a t i o n S t o d e n o t e t h e c a r d i n a l i t y o f a s e t S . I f S i s a s u b s e t o f

    T w e w r i t e S T a n d i f S i s a p r o p e r s u b s e t o f T w e w r i t e S T . F u r t h e r m o r e ,

    S a n d T a r e i n c o m p a r a b l e i f S 6 T a n d T 6 S ; o t h e r w i s e S a n d T a r e c o m p a r a b l e

    W e o f t e n d e n o t e t h e s i n g l e t o n f A g s i m p l y b y A , a n d t h e u n i o n o f t w o s e t s S , T , i . e .

    S T , s i m p l y b y S T . W e w i l l m a k e u s e o f t h e i n d e x s e t I = f 1 ; : : : ; n g

    D e f i n i t i o n 1 . A r e l a t i o n s c h e m a R i s a n i t e s e t o f a t t r i b u t e s w h i c h w e d e n o t e

    b y s c h e m a ( R ) ; w e d e n o t e t h e c a r d i n a l i t y o f s c h e m a ( R ) b y t y p e ( R ) . F r o m n o w o n

    w e a b b r e v i a t e s c h e m a ( R ) t o s c h ( R ) .

    W e a s s u m e a c o u n t a b l y i n n i t e d o m a i n o f c o n s t a n t s , D o m , c o n t a i n i n g t w o d i s -

    t i n g u i s h e d c o n s t a n t s u n k a n d i n c , d e n o t i n g t h e n u l l v a l u e s \ u n k n o w n " a n d \ i n c o n -

    s i s t e n t " , r e s p e c t i v e l y .

    A t y p e ( R ) - t u p l e ( o r s i m p l y a t u p l e w h e n e v e r t y p e ( R ) i s u n d e r s t o o d f r o m c o n t e x t )

    i s a t o t a l m a p p i n g t f r o m s c h ( R ) i n t o D o m s u c h t h a t 8 A

    i

    2 s c h ( R ) , t ( A

    i

    ) 2 D o m

    A r e l a t i o n o v e r R i s a n i t e s e t o f t y p e ( R ) - t u p l e s .

    F r o m n o w o n w e l e t R b e a r e l a t i o n s c h e m a a n d r b e a r e l a t i o n o v e r R . A s u s u a l

    u p p e r c a s e l e t t e r s ( w h i c h m a y b e s u b s c r i p t e d ) f r o m t h e e n d o f t h e a l p h a b e t s u c h a s

    X , Y , Z w i l l b e u s e d t o d e n o t e s e t s o f a t t r i b u t e s , w h i l e t h o s e f r o m t h e b e g i n n i n g o f

  • 8/3/2019 Levene Loizou Incomplete Relations

    8/43

    8 M . L e v e n e a n d G . L o i z o u

    t h e a l p h a b e t s u c h a s A , B , C w i l l b e u s e d t o d e n o t e s i n g l e a t t r i b u t e s o r s i n g l e t o n

    s e t s o f a t t r i b u t e s .

    W e n o t e t h a t w e h a v e a c t u a l l y i n c l u d e d t w o t y p e s o f n u l l v a l u e i n o u r f o r m a l i s m :

    u n k a n d i n c . T h e i n c l u s i o n o f u n k w a s m o t i v a t e d i n t h e i n t r o d u c t i o n a n d t h e

    i n c l u s i o n o f i n c i s m o t i v a t e d b y t h e f a c t t h a t i t a l l o w s u s t o e a s i l y d e t e c t u n w a n t e d

    i n c o n s i s t e n c y .

    D e f i n i t i o n 2 . T h e p r o j e c t i o n o f a t y p e ( R ) - t u p l e t o n t o a s e t o f a t t r i b u t e s Y

    s c h ( R ) , d e n o t e d b y t Y ] ( a n d a l s o c a l l e d t h e Y - v a l u e o f t ) , i s t h e r e s t r i c t i o n o f t t o

    Y . T h e p r o j e c t i o n o f a r e l a t i o n r o n t o Y , d e n o t e d a s

    Y

    ( r ) , i s d e n e d b y

    Y

    ( r ) =

    f t Y ] t 2 r g

    D e f i n i t i o n 3 . A t y p e ( R ) - t u p l e i s s a i d t o b e c o m p l e t e i f 8 A

    i

    2 s c h ( R ) , t A

    i

    6=

    u n k a n d t A

    i

    6= i n c , i . e . t A

    i

    ] i s a n o n n u l l v a l u e , o t h e r w i s e t i s s a i d t o b e i n c o m p l e t e

    t i s s a i d t o b e i n c o n s i s t e n t i f 9 A

    i

    2 s c h ( R ) s u c h t h a t t A

    i

    = i n c , o t h e r w i s e t i s s a i d

    t o b e c o n s i s t e n t

    A r e l a t i o n r i s s a i d t o b e c o m p l e t e i f 8 t 2 r , t i s c o m p l e t e , o t h e r w i s e r i s s a i d t o b e

    i n c o m p l e t e ( w h e n n o c o n f u s i o n a r i s e s w e u s e t h e t e r m r e l a t i o n t o m e a n i n c o m p l e t e

    r e l a t i o n ) . T h e r e l a t i o n r i s s a i d t o b e i n c o n s i s t e n t i f 9 t 2 r s u c h t h a t t i s i n c o n s i s t e n t ,

    o t h e r w i s e r i s s a i d t o b e c o n s i s t e n t

    D e f i n i t i o n 4 . W e d e n e a p a r t i a l o r d e r i n D o m , d e n o t e d b y v , a s f o l l o w s :

    u v v i f a n d o n l y i f u = v o r u = u n k o r v = i n c ; w h e r e u v 2 D o m :

    W e e x t e n d v t o b e a p a r t i a l o r d e r i n t h e s e t o f t y p e ( R ) - t u p l e s a s f o l l o w s : w h e r e

    t

    1

    a n d t

    2

    a r e t y p e ( R ) - t u p l e s , t

    1

    i s l e s s i n f o r m a t i v e t h a n t

    2

    , w r i t t e n t

    1

    v t

    2

    i f 8 A

    i

    2

    s c h ( R ) , t

    1

    A

    i

    v t

    2

    A

    i

    D e f i n i t i o n 5 . T h e s e t o f a l l p o s s i b l e w o r l d s r e l a t i v e t o a r e l a t i o n r , d e n o t e d b y

    P O S S ( r ) , i s d e n e d b y

    P O S S ( r ) = f s s i s a r e l a t i o n o v e r R a n d t h e r e e x i s t s a t o t a l a n d o n t o m a p p i n g

    f r ! s s u c h t h a t 8 t 2 r t v f ( t ) a n d f ( t ) i s c o m p l e t e g

    O u r d e n i t i o n o f p o s s i b l e w o r l d s e m b o d i e s t h e C l o s e d W o r l d A s s u m p t i o n R e i t e r

    1 9 7 8 ; I m i e l i n s k i a n d L i p s k i J r . 1 9 8 4 ] , s i n c e P O S S ( r ) a l l o w s o n l y c o m p l e t e d t u p l e s

    f r o m t h e r e l a t i o n r t o b e p r e s e n t i n P O S S ( r ) . O n t h e o t h e r h a n d , i f w e h a d t a k e n

    t h e O p e n W o r l d A s s u m p t i o n R e i t e r 1 9 7 8 ; I m i e l i n s k i a n d L i p s k i J r . 1 9 8 4 ] , t h e n t h e

    d e n i t i o n o f P O S S ( r ) w o u l d h a v e t o b e r e l a x e d s o a s t o a l l o w a d d i t i o n a l t u p l e s t o

    b e p r e s e n t i n P O S S ( r ) , w h i c h d o n o t n e c e s s a r i l y r e s u l t f r o m c o m p l e t e d t u p l e s i n

    t h e r e l a t i o n r . I t c a n b e s h o w n t h a t t h e r e s u l t s o b t a i n e d h e r e i n a l s o h o l d w h e n

    t h e O W A a p p r o a c h i s t a k e n , s i n c e a c l o s e d w o r l d i n P O S S ( r ) c a n b e v i e w e d a s t h e

    g r e a t e s t l o w e r b o u n d o f a l l o p e n w o r l d s e m a n a t i n g f r o m i t .

    P r o p o s i t i o n 1 . A r e l a t i o n r i s i n c o n s i s t e n t i f a n d o n l y i f P O S S ( r ) = ; 2

    H e r e a f t e r w e a s s u m e t h a t r e l a t i o n s a r e c o n s i s t e n t

  • 8/3/2019 Levene Loizou Incomplete Relations

    9/43

    D a t a b a s e D e s i g n f o r I n c o m p l e t e R e l a t i o n s 9

    3 . N U L L F U N C T I O N A L D E P E N D E N C I E S

    W e n o w d e n e F u n c t i o n a l D e p e n d e n c i e s ( F D s ) a n d t h e i r s a t i s f a c t i o n i n t h e c o n t e x t

    o f i n c o m p l e t e r e l a t i o n s .

    D e f i n i t i o n 6 . A f u n c t i o n a l d e p e n d e n c y o v e r R ( o r s i m p l y a n F D ) i s a s t a t e m e n t

    o f t h e f o r m X ! Y , w h e r e X , Y s c h ( R ) .

    W e c a l l a n F D o f t h e f o r m X ! Y , w h e r e Y X a t r i v i a l F D . T w o n o n t r i v i a l

    F D s o f t h e f o r m s X ! A a n d Y ! A a r e s a i d t o b e i n c o m p a r a b l e i f X a n d Y a r e

    i n c o m p a r a b l e . T w o n o n t r i v i a l F D s o f t h e f o r m s X B ! A a n d Y A ! B a r e s a i d t o

    b e c y c l i c

    W e s t r e s s t h e f a c t t h a t w e a l l o w F D s w h o s e l e f t - h a n d s i d e i s t h e e m p t y s e t . F r o m

    n o w o n w e l e t F b e a s e t o f F D s o v e r R . W e d e n e t h e s i z e o f F , d e n o t e d b y F

    t o b e t h e n u m b e r o f a t t r i b u t e s a p p e a r i n g i n F i n c l u d i n g r e p e t i t i o n s .

    D e f i n i t i o n 7 . A n F D X ! Y i s s a t i s e d i n a r e l a t i o n r , d e n o t e d b y r = X !

    Y , i f a n d o n l y i f 9 s 2 P O S S ( r ) s u c h t h a t 8 t

    1

    t

    2

    2 s , i f t

    1

    X ] = t

    2

    X ] t h e n t

    1

    Y ] =

    t

    2

    Y ] .

    W e n o t e t h a t t h e d e n i t i o n o f s a t i s f a c t i o n o f a n F D i n a r e l a t i o n r e d u c e s t o

    t h e s t a n d a r d d e n i t i o n o f t h e s a t i s f a c t i o n o f a n F D w h e n t h e r e l a t i o n i s c o m p l e t e

    U l l m a n 1 9 8 8 ] ( i n t h a t c a s e t h e r e e x i s t s e x a c t l y o n e s 2 P O S S ( r ) ) .

    T h e f o l l o w i n g l e m m a , w h i c h g i v e s a s y n t a c t i c c h a r a c t e r i s a t i o n o f s a t i s f a c t i o n o f

    a n F D , f o l l o w s f r o m D e n i t i o n 7 ( c f . L e m m a 6 . 2 i n A t z e n i a n d D e A n t o n e l l i s

    1 9 9 3 ] ) .

    L e m m a 2 . L e t r b e a r e l a t i o n a n d X , Y s c h ( R ) . T h e n r = X ! Y i f a n d o n l y

    i f 8 t

    1

    t

    2

    2 r , i f t

    1

    X ] a n d t

    2

    X ] a r e c o m p l e t e a n d t

    1

    X ] = t

    2

    X ] , t h e n t

    1

    Y t t

    2

    Y

    i s c o n s i s t e n t , w h e r e t

    1

    Y t t

    2

    Y ] d e n o t e s t h e l e a s t u p p e r b o u n d o f t

    1

    Y ] a n d t

    2

    Y

    w i t h r e s p e c t t o v 2

    D e f i n i t i o n 8 . A s e t o f F D s F l o g i c a l l y i m p l i e s a n F D X ! Y , w r i t t e n F = X

    ! Y , i f w h e n e v e r r i s a r e l a t i o n t h e n t h e f o l l o w i n g c o n d i t i o n i s t r u e :

    i f 8 W ! Z 2 F r = W ! Z h o l d s t h e n r = X ! Y a l s o h o l d s .

    4 . M O N O D E P E N D E N T S E T S O F F U N C T I O N A L D E P E N D E N C I E S

    W e a s s u m e t h a t t h e r e a d e r i s f a m i l i a r w i t h A r m s t r o n g ' s a x i o m s y s t e m f o r F D s

    A r m s t r o n g 1 9 7 4 ; U l l m a n 1 9 8 8 ; M a n n i l a a n d R a i h a 1 9 9 2 ; A t z e n i a n d D e A n t o n e l l i s

    1 9 9 3 ] , c o n s i s t i n g o f t h e r e e x i v i t y , a u g m e n t a t i o n a n d t r a n s i t i v i t y i n f e r e n c e r u l e s .

    A f u n d a m e n t a l r e s u l t i n r e l a t i o n a l d a t a b a s e t h e o r y i s t h a t A r m s t r o n g ' s a x i o m s y s -

    t e m i s s o u n d a n d c o m p l e t e f o r F D s h o l d i n g i n c o m p l e t e r e l a t i o n s . W e d e n o t e t h e

    c l o s u r e o f a s e t o f F D s F o v e r R w i t h r e s p e c t t o A r m s t r o n g ' s a x i o m s y s t e m b y

    F

    +

    . L i e n L i e n 1 9 8 2 ] a n d A t z e n i a n d M o r f u n i A t z e n i a n d M o r f u n i 1 9 8 6 ] s h o w e d

    t h a t t h e i n f e r e n c e r u l e s : r e e x i v i t y , a u g m e n t a t i o n , d e c o m p o s i t i o n a n d u n i o n , a r e

    s o u n d a n d c o m p l e t e f o r F D s h o l d i n g i n i n c o m p l e t e r e l a t i o n s ; w e c a l l t h i s a x i o m

    s y s t e m , L i e n a n d A t z e n i ' s a x i o m s y s t e m . T h a t i s , b y d r o p p i n g t h e t r a n s i t i v i t y r u l e

  • 8/3/2019 Levene Loizou Incomplete Relations

    10/43

    1 0 M . L e v e n e a n d G . L o i z o u

    f r o m A r m s t r o n g ' s a x i o m s y s t e m a n d a d d i n g t h e d e c o m p o s i t i o n a n d u n i o n r u l e s ,

    w e o b t a i n L i e n a n d A t z e n i ' s a x i o m s y s t e m . W e d e n o t e t h e c l o s u r e o f a s e t o f F D s

    F o v e r R w i t h r e s p e c t t o L i e n a n d A t z e n i ' s a x i o m s y s t e m b y F

    . T h e s o u n d n e s s

    a n d c o m p l e t e n e s s o f L i e n a n d A t z e n i ' s a x i o m s y s t e m f o r F D s h o l d i n g i n i n c o m p l e t e

    r e l a t i o n s c a n b e w r i t t e n s y m b o l i c a l l y a s t h e s t a t e m e n t : F = X ! Y i f a n d o n l y i f

    X ! Y 2 F

    D e f i n i t i o n 9 . A s e t o f F D s G o v e r R i s a c o v e r o f F i f F

    +

    = G

    +

    D e f i n i t i o n 1 0 . A n F D X ! Y 2 F

    +

    i s r e d u c e d B e e r i a n d B e r n s t e i n 1 9 7 9 ] i f

    t h e r e d o e s n o t e x i s t a s e t o f a t t r i b u t e s W X s u c h t h a t W ! Y 2 F

    +

    . A s e t o f

    F D s F i s r e d u c e d i f a l l t h e F D s i n F a r e r e d u c e d .

    W e n o t e t h a t a r e d u c e d c o v e r G o f F c a n b e o b t a i n e d i n p o l y n o m i a l t i m e i n t h e

    s i z e o f F B e e r i a n d B e r n s t e i n 1 9 7 9 ] .

    D e f i n i t i o n 1 1 . A s e t o f F D s F i s a m o n o d e p e n d e n t s e t o f F D s o v e r R ( o r s i m -

    p l y m o n o d e p e n d e n t w h e n e v e r R i s u n d e r s t o o d f r o m c o n t e x t ) i f 8 A 2 s c h ( R ) , t h e

    f o l l o w i n g t w o c o n d i t i o n s a r e t r u e :

    ( 1 ) W h e n e v e r t h e r e e x i s t i n c o m p a r a b l e F D s , X ! A Y ! A 2 F

    +

    , t h e n X \

    Y ! A 2 F

    +

    ; w e c a l l t h i s p r o p e r t y t h e i n t e r s e c t i o n p r o p e r t y

    ( 2 ) W h e n e v e r t h e r e e x i s t c y c l i c F D s , X B ! A , Y A ! B 2 F

    +

    , t h e n e i t h e r Y

    ! B 2 F

    +

    o r ( X \ Y ) A ! B 2 F

    +

    ; w e c a l l t h i s p r o p e r t y t h e s p l i t - f r e e n e s s

    p r o p e r t y

    A n i m m e d i a t e c o n s e q u e n c e o f t h e a b o v e d e n i t i o n i s t h a t i f G o v e r R i s a c o v e r

    o f F , t h e n F i s m o n o d e p e n d e n t i f a n d o n l y i f G i s m o n o d e p e n d e n t . I n a d d i t i o n , w e

    h a v e s h o w n i n L e v e n e a n d L o i z o u 1 9 9 7 ] t h a t m o n o d e p e n d e n c e o f F c a n b e c h e c k e d

    i n p o l y n o m i a l t i m e i n t h e s i z e o f F .

    W e o b s e r v e t h a t t h e t w o d e n i n g p r o p e r t i e s o f m o n o d e p e n d e n t s e t s o f F D s c o r r e -

    s p o n d t o t h e t w o d e n i n g p r o p e r t i e s o f c o n i c t - f r e e s e t s o f m u l t i v a l u e d d e p e n d e n c i e s

    ( M V D s ) S c i o r e 1 9 8 1 ; L i e n 1 9 8 2 ; B e e r i e t a l . 1 9 8 3 ; B e e r i a n d K i f e r 1 9 8 6 ] . W e f u r -

    t h e r o b s e r v e t h a t t h e s e t o f M V D s t h a t i s l o g i c a l l y i m p l i e d b y a m o n o d e p e n d e n t

    s e t o f F D s m a y n o t b e c o n i c t - f r e e a n d t h u s m o n o d e p e n d e n c e i s a w e a k e r n o t i o n

    t h a n c o n i c t - f r e e n e s s . F o r e x a m p l e , l e t F = f A ! B B ! A g , w i t h s c h ( R ) = f A

    B C g . I t c a n e a s i l y b e v e r i e d t h a t F i s m o n o d e p e n d e n t b u t t h a t t h e s e t o f M V D s

    l o g i c a l l y i m p l i e d b y F i s n o t c o n i c t - f r e e .

    T h e n e x t t h e o r e m , w h o s e p r o o f c a n b e f o u n d i n L e v e n e a n d L o i z o u 1 9 9 7 ] , s h o w s

    t h a t a s s u m i n g t h a t F i s r e d u c e d a n d s a t i s e s t h e i n t e r s e c t i o n p r o p e r t y , t h e n t h e

    c l o s u r e o f F w i t h r e s p e c t t o A r m s t r o n g ' s a x i o m s y s t e m ( i . e . F

    +

    ) i s e q u a l t o t h e

    c l o s u r e o f F w i t h r e s p e c t t o L i e n a n d A t z e n i ' s a x i o m s y s t e m ( i . e . F

    ) . T h i s r e s u l t

    i s f u n d a m e n t a l t o t h e t h e o r y o f F D s i n i n c o m p l e t e r e l a t i o n s , s i n c e i t j u s t i e s t h e

    u s e o f A r m s t r o n g ' s a x i o m s y s t e m i n t h e c o n t e x t o f i n c o m p l e t e r e l a t i o n s w h e n F i s

    m o n o d e p e n d e n t .

    T h e o r e m 3 . A s s u m e t h a t F i s r e d u c e d . I f F s a t i s e s t h e i n t e r s e c t i o n p r o p e r t y

    t h e n F

    +

    = F

    2

  • 8/3/2019 Levene Loizou Incomplete Relations

    11/43

    D a t a b a s e D e s i g n f o r I n c o m p l e t e R e l a t i o n s 1 1

    T h e c o n v e r s e o f T h e o r e m 3 i s , i n g e n e r a l , f a l s e . F o r e x a m p l e , l e t F = f A !

    C B ! C g , w i t h s c h ( R ) = f A , B , C g . I t c a n b e e a s i l y v e r i e d t h a t F

    +

    = F

    h o w e v e r , F d o e s n o t s a t i s f y t h e i n t e r s e c t i o n p r o p e r t y , s i n c e ; ! C 62 F

    +

    . M o r e o v e r ,

    i f F s a t i s e s t h e s p l i t - f r e e n e s s p r o p e r t y b u t n o t t h e i n t e r s e c t i o n p r o p e r t y , t h e n , i n

    g e n e r a l , F

    +

    6= F

    . F o r e x a m p l e , l e t F = f A ! B B ! C g , w i t h s c h ( R ) = f A , B ,

    C g . I t c a n b e e a s i l y v e r i e d t h a t F s a t i s e s t h e s p l i t - f r e e n e s s p r o p e r t y b u t n o t t h e

    i n t e r s e c t i o n p r o p e r t y , a n d a l s o t h a t F

    +

    6= F

    T h e f o l l o w i n g p r o p o s i t i o n p e r t a i n i n g t o t h e p r o p e r t y o f d e r i v a t i o n s o f F D s , u s i n g

    A r m s t r o n g ' s a x i o m s y s t e m , w h i c h a p p e a r s a s L e m m a 2 i n B e e r i a n d B e r n s t e i n

    1 9 7 9 ] , w i l l b e f r e q u e n t l y u s e d i n s u b s e q u e n t p r o o f s . W e s t a t e i t i n a s l i g h t l y a l t e r e d

    f o r m f r o m t h e o r i g i n a l ; h e r e i n t h e u s e o f a n F D W ! Z 2 F i n a d e r i v a t i o n o f a n

    F D X ! Y 2 F

    +

    i s s a i d t o b e n o n r e d u n d a n t i f w e c a n n o t o m i t W ! Z f r o m t h e

    d e r i v a t i o n a n d s t i l l i n f e r X ! Y 2 F

    +

    P r o p o s i t i o n 4 . L e t F b e a s e t o f F D s a n d a s s u m e t h a t W ! Z 2 F i s u s e d

    n o n r e d u n d a n t l y i n a d e r i v a t i o n o f a n F D X ! Y 2 F

    +

    f r o m F b y u s i n g A r m s t r o n g ' s

    a x i o m s y s t e m . T h e n X ! W 2 ( F ? f W ! Z g )

    +

    2

    I n s o m e s u b s e q u e n t p r o o f s w e u t i l i s e t h e p s e u d o - t r a n s i t i v i t y i n f e r e n c e r u l e U l l -

    m a n 1 9 8 8 ] , w h i c h s t a t e s t h a t i f X ! Y 2 F

    +

    a n d W Y ! Z 2 F

    +

    , t h e n i t i s a l s o

    t h e c a s e t h a t X W ! Z 2 F

    +

    5 . T H E A D D I T I V I T Y P R O B L E M F O R N U L L F U N C T I O N A L D E P E N D E N C I E S

    W e n e x t g e n e r a l i s e t h e d e n i t i o n o f s a t i s f a c t i o n o f a s i n g l e F D t o s a t i s f a c t i o n o f a

    s e t o f F D s , a n d d i s c u s s t h e s e m a n t i c s o f t h i s g e n e r a l i s e d d e n i t i o n .

    D e f i n i t i o n 1 2 . A s e t o f F D s F i s s a t i s e d i n a r e l a t i o n r , d e n o t e d b y r = F , i f

    a n d o n l y i f 9 s 2 P O S S ( r ) s u c h t h a t 8 X ! Y 2 F s = X ! Y

    F o l l o w i n g A t z e n i a n d D e A n t o n e l l i s 1 9 9 3 ] w e n e x t d e n e a d d i t i v e s a t i s f a c t i o n .

    D e f i n i t i o n 1 3 . S a t i s f a c t i o n i s a d d i t i v e w i t h r e s p e c t t o a c l a s s o f r e l a t i o n s R C

    o v e r R a n d a c l a s s o f s e t s o f F D s F C o v e r R , w h e n e v e r : 8 r 2 R C 8 F 2 F C r =

    F i f a n d o n l y i f t h e r e e x i s t s a r e d u c e d c o v e r G o f F s u c h t h a t 8 X ! Y 2 G r =

    X ! Y

    T h e n e x t e x a m p l e s h o w s t h a t i n D e n i t i o n 1 3 w e c a n n o t r e l a x t h e r e q u i r e m e n t

    t h a t G b e a r e d u c e d c o v e r .

    E x a m p l e 1 . C o n s i d e r t h e r e l a t i o n r

    1

    s h o w n i n T a b l e 1 a n d l e t F = f A ! B

    A B ! C g . I t c a n e a s i l y b e v e r i e d t h a t r

    1

    = A ! B a n d r

    1

    = A B ! C b u t r

    1

    6 =

    F . O n t h e o t h e r h a n d , i f w e l e t G = f A ! B A ! C g , i . e . G i s a r e d u c e d c o v e r o f

    F , t h e n r

    1

    6 = A ! C

    T h e f o l l o w i n g f u n d a m e n t a l r e s u l t w a s s h o w n i n L e v e n e a n d L o i z o u 1 9 9 7 ] .

    T h e o r e m 5 . S a t i s f a c t i o n i s a d d i t i v e w i t h r e s p e c t t o t h e c l a s s o f a l l r e l a t i o n s

    o v e r R a n d a c l a s s o f s e t s o f F D s F C i f a n d o n l y i f a l l t h e s e t s o f F D s i n F C a r e

    m o n o d e p e n d e n t . 2

  • 8/3/2019 Levene Loizou Incomplete Relations

    12/43

    1 2 M . L e v e n e a n d G . L o i z o u

    6 . O P T I M U M C O V E R S O F M O N O D E P E N D E N T S E T S O F F D S

    A s e t o f F D s F o v e r R i s m i n i m u m i f t h e r e d o e s n o t e x i s t a c o v e r o f F w i t h f e w e r

    F D s t h a n F a n d a l l t h e l e f t - h a n d s i d e s a n d r i g h t - h a n d s i d e s o f t h e F D s i n F a r e

    m i n i m a l ; i n M a i e r 1 9 8 0 ] a m i n i m u m s e t o f F D s i s c a l l e d a n L R - m i n i m u m s e t o f

    F D s .

    D e f i n i t i o n 1 4 . A s e t o f F D s F i s a m i n i m u m s e t o f F D s i f t h e r e i s n o c o v e r G

    o f F s u c h t h a t G h a s f e w e r F D s t h a n F , a l l t h e F D s i n F a r e r e d u c e d a n d f o r e v e r y

    F D X ! Y 2 F a n d f o r e v e r y Z Y , ( ( F ? f X ! Y g ) f X ! Z g )

    +

    6= F

    +

    A s e t o f F D s F o v e r R i s o p t i m u m i f t h e r e d o e s n o t e x i s t a c o v e r o f F w h o s e s i z e

    i s l e s s t h a n t h e s i z e o f F M a i e r 1 9 8 0 ] .

    D e f i n i t i o n 1 5 . F i s a n o p t i m u m s e t o f F D s i f t h e r e d o e s n o t e x i s t a c o v e r G o f

    F s u c h t h a t G

  • 8/3/2019 Levene Loizou Incomplete Relations

    13/43

    D a t a b a s e D e s i g n f o r I n c o m p l e t e R e l a t i o n s 1 3

    a n d t h e r e f o r e W ! A 2 ( F ? E

    F

    ( X ) )

    +

    , s i n c e o t h e r w i s e W ! Z 2 F

    +

    , w i t h Z ! X

    2 F

    +

    , i m p l y i n g t h a t W ! X 2 F

    +

    l e a d i n g t o a c o n t r a d i c t i o n . T h e r e s u l t f o l l o w s ,

    s i n c e w e c a n r e m o v e A f r o m Y w i t h o u t c h a n g i n g F

    +

    c o n t r a d i c t i n g t h e f a c t t h a t F

    i s m i n i m u m . 2

    W e c l o s e t h i s s e c t i o n w i t h t h e d e n i t i o n o f t h e c o n c e p t o f o p t i m u m l e f t - h a n d

    s i d e s M a n n i l a a n d R a i h a 1 9 8 3 ] .

    D e f i n i t i o n 1 7 . A m i n i m u m s e t o f F D s F h a s o p t i m u m l e f t - h a n d s i d e s i f f o r a l l

    m i n i m u m c o v e r s G o f F w e h a v e t h a t

    X

    X ! Y 2 F

    X

    X

    W ! Z 2 G

    W

    6 . 1 L R - M i n i m u m c o v e r s o f s e t s o f F D s t h a t s a t i s f y t h e i n t e r s e c t i o n p r o p e r t y a r e o p t i -

    m u m

    W e s h o w t h a t s e t s o f F D s w h i c h s a t i s f y t h e i n t e r s e c t i o n p r o p e r t y h a v e t h e d e s i r a b l e

    p r o p e r t y t h a t a m i n i m u m s e t o f F D s i s a l s o o p t i m u m . T h i s i m p l i e s t h a t a n o p t i m u m

    c o v e r o f F t h a t s a t i s e s t h e i n t e r s e c t i o n p r o p e r t y c a n b e c o m p u t e d i n p o l y n o m i a l

    t i m e i n t h e s i z e o f F d u e t o t h e f a c t t h a t a m i n i m u m c o v e r o f F c a n b e c o m p u t e d i n

    p o l y n o m i a l t i m e i n t h e s i z e o f F M a i e r 1 9 8 0 ] . I n g e n e r a l , w h e n a s e t o f F D s d o e s

    n o t s a t i s f y t h e i n t e r s e c t i o n p r o p e r t y , t h e n n d i n g a n o p t i m u m c o v e r i s N P - c o m p l e t e

    M a i e r 1 9 8 0 ] . W e s h o w t h a t a s e t o f F D s w h i c h s a t i s e s t h e i n t e r s e c t i o n p r o p e r t y

    h a s a u n i q u e o p t i m u m c o v e r . ( W e o b s e r v e t h a t a s e t o f F D s c a n b e o p t i m u m b u t

    n o t s a t i s f y t h e i n t e r s e c t i o n p r o p e r t y s u c h a s t h e s e t o f F D s f B ! A C ! A g )

    T h e e n s u i n g l e m m a s p r o v i d e t h e t e c h n i c a l b a c k g r o u n d n e e d e d t o p r o v e t h e m a i n

    r e s u l t o f t h i s s e c t i o n , n a m e l y T h e o r e m 1 5 .

    L e m m a 1 0 . L e t F b e a s e t o f F D s t h a t i s m i n i m u m a n d s a t i s e s t h e i n t e r s e c t i o n

    p r o p e r t y . T h e n 8 A 2 s c h ( R ) , t h e r e i s a t m o s t o n e F D , X ! Y 2 F , s u c h t h a t A

    2 Y

    P r o o f . S u p p o s e t o t h e c o n t r a r y t h a t X ! Y W ! Z 2 F a r e d i s t i n c t F D s s u c h t h a t

    A 2 Y \ Z . I f X a n d W a r e c o m p a r a b l e , t h e n t h e r e s u l t f o l l o w s , s i n c e w e c a n r e m o v e

    A f r o m o n e o f Y o r Z w i t h o u t c h a n g i n g F

    +

    , a n d t h u s F c a n n o t b e m i n i m u m . O n

    t h e o t h e r h a n d , i f X a n d W a r e i n c o m p a r a b l e , t h e n X \ W ! A 2 F

    +

    , s i n c e F

    s a t i s e s t h e i n t e r s e c t i o n p r o p e r t y . N o w , b o t h X \ W ! X 62 F

    +

    a n d X \ W ! W

    62 F

    +

    h o l d , s i n c e o t h e r w i s e w e c a n r e p l a c e X ! Y b y X \ W ! Y , o r r e s p e c t i v e l y ,

    w e c a n r e p l a c e W ! Z b y X \ W ! Z , w i t h o u t c h a n g i n g F

    +

    , a n d t h u s F c a n n o t

    b e m i n i m u m . T h e r e f o r e , t h e r e e x i s t s a n F D V ! U 2 F , w h i c h i s d i s t i n c t f r o m X

    ! Y a n d W ! Z , s u c h t h a t X \ W ! V 2 ( F ? f X ! Y W ! Z g )

    +

    a n d A 2

    U . I t f o l l o w s t h a t A c a n b e r e m o v e d f r o m b o t h Y a n d Z w i t h o u t c h a n g i n g F

    +

    , a n d

    t h u s F i s n o t m i n i m u m . 2

    T h e n e x t r e s u l t , w h i c h i s a c o r o l l a r y o f L e m m a 1 0 , g i v e s a n u p p e r b o u n d f o r t h e

    c a r d i n a l i t y o f F w h e n F i s m i n i m u m a n d s a t i s e s t h e i n t e r s e c t i o n p r o p e r t y .

    C o r o l l a r y 1 1 . L e t F b e a s e t o f F D s t h a t i s m i n i m u m a n d s a t i s e s t h e i n t e r -

    s e c t i o n p r o p e r t y . T h e n F t y p e ( R ) . 2

  • 8/3/2019 Levene Loizou Incomplete Relations

    14/43

    1 4 M . L e v e n e a n d G . L o i z o u

    L e m m a 1 2 . L e t F a n d G b e t w o s e t s o f F D s o v e r R , w h i c h a r e m i n i m u m , s a t i s f y

    t h e i n t e r s e c t i o n p r o p e r t y a n d a r e c o v e r s o f e a c h o t h e r . T h e n Y = Z , w h e n e v e r X

    ! Y 2 F a n d X ! Z 2 G

    P r o o f . A s s u m e t o t h e c o n t r a r y t h a t Y 6= Z a n d t h a t 9 A 2 Y s u c h t h a t A 62 Z

    a s y m m e t r i c a r g u m e n t c a n b e u s e d i f w e a s s u m e t h a t 9 A 2 Z s u c h t h a t A 62 Y

    I t f o l l o w s b y L e m m a 1 0 t h a t t h e r e i s a u n i q u e F D V ! U 2 G s u c h t h a t A 2 U

    M o r e o v e r , b y P r o p o s i t i o n 4 X ! V 2 ( G ? f V ! U g )

    +

    a n d b y t h e i n t e r s e c t i o n

    p r o p e r t y X \ V ! A 2 G

    +

    W e c l a i m t h a t V X h o l d s . F i r s t l y , i f X V , t h e n G i s n o t m i n i m u m , s i n c e

    X ! Z a n d V ! U c a n b e r e p l a c e d b y X ! U Z . S e c o n d l y , i f V 6 X , t h e n X \

    V

  • 8/3/2019 Levene Loizou Incomplete Relations

    15/43

    D a t a b a s e D e s i g n f o r I n c o m p l e t e R e l a t i o n s 1 5

    N e x t , s u p p o s e t h a t Y \ W = ; a n d X \ Z = ; b u t t h a t Y \ Z 6= ; . L e t A 2 Y

    \ Z a n d t h u s A 62 X W . I t f o l l o w s b y t h e i n t e r s e c t i o n p r o p e r t y t h a t ( X \ W ) ! A

    2 G

    +

    , w i t h X \ W

  • 8/3/2019 Levene Loizou Incomplete Relations

    16/43

    1 6 M . L e v e n e a n d G . L o i z o u

    B y P r o p o s i t i o n 4 , X ! W 2 ( G ? f W ! Z g )

    +

    . T h e r e f o r e , X ! Y 2 ( G ? f W

    ! Z g )

    +

    , s i n c e Y W . L e t A 2 Y , a n d t h u s A 62 Z . H e n c e f o r s o m e F D V ! U 2

    G , w h i c h i s d i s t i n c t f r o m W ! Z , w e h a v e t h a t A 2 U . F u r t h e r m o r e , V 6= X , s i n c e

    o t h e r w i s e b y L e m m a 1 2 U = Y c o n t r a d i c t i n g t h e f a c t t h a t X ! Y 62 G . T h e r e a r e

    t h r e e c a s e s t o c o n s i d e r .

    F i r s t l y , a s s u m e t h a t X V . I t f o l l o w s b y P r o p o s i t i o n 4 t h a t X ! V 2 ( G ? f V

    ! U g )

    +

    , s i n c e b y L e m m a 1 0 V ! U i s t h e o n l y F D i n G w i t h A i n i t s r i g h t - h a n d

    s i d e . T h i s c o n t r a d i c t s t h e f a c t t h a t G i s o p t i m u m , s i n c e w e c a n r e p l a c e V ! U 2

    G b y X ! U w i t h o u t c h a n g i n g G

    +

    S e c o n d l y , a s s u m e t h a t V X . I t f o l l o w s b y P r o p o s i t i o n 4 t h a t V ! X 2 ( F ? f X

    ! Y g )

    +

    , s i n c e b y L e m m a 1 0 X ! Y i s t h e o n l y F D i n F w i t h A i n i t s r i g h t - h a n d

    s i d e . T h i s c o n t r a d i c t s t h e f a c t t h a t F i s m i n i m u m , s i n c e w e c a n r e p l a c e X ! Y 2

    F b y V ! Y w i t h o u t c h a n g i n g F

    +

    T h i r d l y , a s s u m e t h a t X a n d V a r e i n c o m p a r a b l e . T h u s b y t h e i n t e r s e c t i o n p r o p -

    e r t y X \ V ! A 2 F

    +

    , w i t h X \ V

  • 8/3/2019 Levene Loizou Incomplete Relations

    17/43

    D a t a b a s e D e s i g n f o r I n c o m p l e t e R e l a t i o n s 1 7

    6 . 2 L R - M i n i m u m c o v e r s o f s e t s o f F D s t h a t s a t i s f y t h e s p l i t - f r e e n e s s p r o p e r t y h a v e

    o p t i m u m l e f t - h a n d s i d e s

    T h e n e x t e x a m p l e s h o w s t h a t t h e a n a l o g u e o f T h e o r e m 1 5 d o e s n o t h o l d f o r s e t s o f

    F D s t h a t s a t i s f y t h e s p l i t - f r e e n e s s p r o p e r t y .

    E x a m p l e 2 . L e t R b e a r e l a t i o n s c h e m a , w i t h s c h ( R ) = f A , B , C , D g a n d l e t F

    = f A D ! B C , B D ! A , C D ! A g . I t c a n e a s i l y b e v e r i e d t h a t F i s m i n i m u m a n d

    s a t i s e s t h e s p l i t - f r e e n e s s p r o p e r t y . O n t h e o t h e r h a n d , F i s n o t o p t i m u m , s i n c e G

    = f A D ! B , B D ! C , C D ! A g i s a n o p t i m u m c o v e r o f F w i t h G

  • 8/3/2019 Levene Loizou Incomplete Relations

    18/43

    1 8 M . L e v e n e a n d G . L o i z o u

    V

    1

    \ X

    1

    = ; a n d V

    2

    \ W

    1

    = ; . F u r t h e r m o r e , w e h a v e t h a t X

    1

    ? A 6= ; , s i n c e

    W

    1

    > 1 t h u s l e a d i n g t o a c o n t r a d i c t i o n o f t h e f a c t t h a t W

    1

    \ X

    1

    = ; . T h e c l a i m

    t h a t X = W f o l l o w s .

    S e c o n d l y , B 62 W

    1

    a n d t h u s B 2 ( W ? X ) ? W

    1

    . I t f o l l o w s b y t h e p s e u d o -

    t r a n s i t i v i t y i n f e r e n c e r u l e t h a t V

    1

    V

    2

    W

    1

    ( X

    1

    ? A ) ! B 2 G

    +

    ; a s s u m e w i t h o u t l o s s

    o f g e n e r a l i t y t h a t t h i s F D i s r e d u c e d . W e c o n c l u d e t h e r e s u l t b y i n d u c t i o n o n k =

    X

    1

    ? A . I n t h e b a s i s s t e p w h e n k = 0 t h e r e s u l t f o l l o w s , s i n c e W ! Z 2 G c a n b e

    r e p l a c e d b y W ? B ! Z w i t h o u t c h a n g i n g G

    +

    , t h u s c o n t r a d i c t i n g t h e f a c t t h a t G i s

    m i n i m u m .

    I n t h e i n d u c t i o n s t e p w h e n k > 0 , w e h a v e t h a t X

    1

    ? A 6= ; ; l e t A 2 X

    1

    ? A

    I t f o l l o w s t h a t f o r s o m e W

    2

    W ? X a n d f o r s o m e V

    3

    V V

    3

    W

    2

    ! A 2 G

    +

    i s

    r e d u c e d .

    I f B 2 W

    2

    t h e n b y L e m m a 1 9 V

    1

    V

    2

    = V

    3

    , a n d i n a d d i t i o n w e h a v e t h a t W

    2

    ? B

    = W

    1

    ( X

    1

    ? A A ) i m p l y i n g t h a t X

    1

    = A A a n d t h a t W

    2

    ? B = W

    1

    , i n w h i c h c a s e

    V

    1

    V

    2

    W

    2

    ! A 2 F

    +

    a n d V

    2

    X

    1

    ! B 2 F

    +

    a r e r e d u c e d a n d c y c l i c F D s , a n d t h u s b y

    L e m m a 1 9 w e c o n c l u d e t h a t X

    1

    = A , d u e t o t h e f a c t t h a t X

    1

    \ W

    2

    = ; . I t f o l l o w s

    t h a t X

    1

    = 1 , w h i c h c o n t r a d i c t s t h e f a c t t h a t k > 0

    O n t h e o t h e r h a n d , i f B 62 W

    2

    t h e n b y t h e p s e u d o - t r a n s i t i v i t y i n f e r e n c e r u l e

    V W

    1

    W

    2

    ( X

    1

    ? A A ) ! B 2 G

    +

    . T h e r e s u l t f o l l o w s b y i n d u c t i v e h y p o t h e s i s , s i n c e

    X

    1

    ? A A

  • 8/3/2019 Levene Loizou Incomplete Relations

    19/43

    D a t a b a s e D e s i g n f o r I n c o m p l e t e R e l a t i o n s 1 9

    W e n e x t d e n e t h e n o t i o n o f a n a n n u a l c o v e r o f a s e t o f F D s t h a t s a t i s e s t h e

    s p l i t - f r e e n e s s p r o p e r t y ; t h e n a m e o r i g i n a t e s f r o m M a i e r 1 9 8 3 ] ( c f . c i r c u l a r s e t o f

    F D s A t z e n i a n d D e A n t o n e l l i s 1 9 9 3 ] ) .

    D e f i n i t i o n 1 8 . L e t F b e a s e t o f F D s t h a t i s m i n i m u m a n d s a t i s e s t h e s p l i t -

    f r e e n e s s p r o p e r t y a n d l e t E

    F

    ( X ) = f X

    1

    ! Y

    1

    ; : : : ; X

    n

    ! Y

    n

    g b e a n o n e m p t y

    e q u i v a l e n c e c l a s s o f F f o r s o m e X s c h ( R ) . W e d e n o t e t h e s e t o f a t t r i b u t e s

    S

    n

    i = 1

    Y

    i

    ?

    S

    n

    i = 1

    X

    i

    b y A C Y ( X ) a n d t h e s e t o f a t t r i b u t e s

    S

    n

    i = 1

    Y

    i

    \

    S

    n

    i = 1

    X

    i

    b y

    C Y C ( X ) a s s u m i n g t h a t F i s u n d e r s t o o d f r o m c o n t e x t .

    T h e s e t o f F D s F i s a n n u a l i f e a c h n o n e m p t y e q u i v a l e n c e c l a s s E

    F

    ( X ) o f F h a s

    t h e f o r m , f X

    1

    ! Y A

    1

    ; : : : ; X

    n

    ! A

    n

    g , w h e r e Y = A C Y ( X ) . I n a d d i t i o n , i f n > 1

    t h e n 8 i 2 I A

    i

    2 C Y C ( X ) ? X

    i

    , o t h e r w i s e , i f n = 1 t h e n A

    1

    = ; , i . e . E

    F

    ( X ) h a s

    t h e f o r m f X

    1

    ! Y g

    L e m m a 2 3 . L e t F b e a s e t o f F D s t h a t i s m i n i m u m a n d s a t i s e s t h e s p l i t - f r e e n e s s

    p r o p e r t y , a n d l e t B 2 A C Y ( X ) f o r s o m e X s c h ( R ) . T h e n t h e r e d o e s n o t e x i s t a

    r e d u c e d F D W B ! A 2 F

    +

    s u c h t h a t Z A 2 L H S ( X ) f o r s o m e Z s c h ( R ) .

    P r o o f . S u p p o s e t o t h e c o n t r a r y t h a t t h e r e e x i s t s a r e d u c e d F D W B ! A 2 F

    +

    w i t h Z A 2 L H S ( X ) f o r s o m e Z s c h ( R ) . T h e n b y a s i m i l a r a r g u m e n t t o t h a t m a d e

    i n t h e p r o o f o f L e m m a 9 w e h a v e t h a t Z A ! B 2 F

    +

    i s r e d u c e d . T h e r e f o r e W B !

    A 2 F

    +

    a n d Z A ! B 2 F

    +

    a r e r e d u c e d a n d c y c l i c F D s a n d t h u s b y L e m m a 1 9 w e

    h a v e t h a t W = Z . I t f o l l o w s t h a t W B 2 L H S ( X ) a n d t h u s B 2 C Y C ( X ) l e a d i n g t o

    a c o n t r a d i c t i o n o f t h e a s s u m p t i o n t h a t B 2 A C Y ( X ) . 2

    L e m m a 2 4 . L e t F b e a s e t o f F D s w h i c h s a t i s e s t h e s p l i t - f r e e n e s s p r o p e r t y .

    T h e n a n a n n u a l c o v e r o f F c a n b e o b t a i n e d i n p o l y n o m i a l t i m e i n t h e s i z e o f F .

    P r o o f . B y T h e o r e m 3 i n M a i e r 1 9 8 0 ] a m i n i m u m c o v e r o f F c a n b e c o m p u t e d i n

    p o l y n o m i a l t i m e i n t h e s i z e o f F . S o a s s u m e t h a t F i s m i n i m u m a n d l e t E

    F

    ( X ) =

    f X

    1

    ! Y

    1

    ; : : : ; X

    n

    ! Y

    n

    g ( n > 1 ) b e a n o n e m p t y e q u i v a l e n c e c l a s s o f F f o r s o m e

    X s c h ( R ) ; i f n = 1 t h e n t h e r e s u l t h o l d s t r i v i a l l y . W e n e x t p r o c e e d t o c o n s t r u c t

    a n a n n u a l c o v e r G o f F b y c o n s i d e r i n g t h e e q u i v a l e n c e c l a s s e s o f t h e l a t t e r ; l e t

    Y = A C Y ( X ) . L e t E

    G

    ( X ) = f X

    1

    ! Y ( X

    2

    ? X

    1

    ) X

    2

    ! ( X

    3

    ? X

    2

    ) ; : : : ; X

    n

    !

    ( X

    1

    ? X

    n

    ) g . B y L e m m a 2 2 w e h a v e t h a t 8 i 2 I X

    i + 1

    ? X

    i

    = 1 , t a k i n g n + 1 t o

    b e 1 . T h e r e f o r e , E

    G

    ( X ) c a n b e r e w r i t t e n a s f X

    1

    ! Y A

    1

    ; : : : ; X

    n

    ! A

    n

    g s u c h t h a t

    8 i 2 I A

    i

    = X

    i + 1

    ? X

    i

    a n d A

    i

    62 X

    i

    . I t o n l y r e m a i n s t o s h o w t h a t G i s a m i n i m u m

    c o v e r o f F .

    I t c a n b e v e r i e d t h a t E

    G

    ( X )

    +

    = E

    F

    ( X )

    +

    a n d t h u s G i s a c o v e r o f F . F u r t h e r m o r e ,

    a l l t h e F D s i n E

    G

    ( X ) a r e r e d u c e d ; t h i s c a n b e p r o v e d b y u s i n g a s i m i l a r a r g u m e n t

    t o t h a t g i v e n i n t h e p r o o f o f L e m m a 9 . L e t u s d e n o t e X

    1

    b y X a n d A

    1

    b y A . W e

    c l a i m t h a t f o r e v e r y Z Y A , ( ( G ? f X ! Y A g ) f X ! Z g )

    +

    6= G

    +

    . A s s u m e

    t h a t ( ( G ? f X ! Y A g ) f X ! Z g )

    +

    = G

    +

    . T h e r e a r e t w o c a s e s t o c o n s i d e r .

    F i r s t l y , A 62 Z . T h e r e a r e t w o s u b c a s e s t o c o n s i d e r . I n t h e r s t s u b c a s e X ! A 2

    ( F ? E

    F

    ( X ) )

    +

    l e a d i n g t o a c o n t r a d i c t i o n o f t h e f a c t t h a t F i s m i n i m u m , s i n c e w e

    c a n r e p l a c e E

    F

    ( X ) b y f X

    2

    ! Y A

    2

    ; : : : ; X

    n

    ! A

    n

    g w i t h o u t c h a n g i n g F

    +

    . I n t h e

    s e c o n d s u b c a s e X ! A 62 ( F ? E

    F

    ( X ) )

    +

    a n d t h u s d u e t o o u r a s s u m p t i o n 9 B 2

  • 8/3/2019 Levene Loizou Incomplete Relations

    20/43

    2 0 M . L e v e n e a n d G . L o i z o u

    Y s u c h t h a t f o r s o m e W s c h ( R ) , W B ! A 2 F

    +

    i s r e d u c e d a n d W B 62 L H S ( X )

    l e a d i n g t o a c o n t r a d i c t i o n o f L e m m a 2 3 , s i n c e A 2 C Y C ( X ) .

    S e c o n d l y , A 2 Z . L e t B 2 Y ? Z a n d t h e r e f o r e 9 i 2 I s u c h t h a t B 2 Y

    i

    . I n v i e w

    o f o u r a s s u m p t i o n i t f o l l o w s t h a t ( ( F ? f X

    i

    ! Y

    i

    g ) f X

    i

    ! Y

    i

    ? B g )

    +

    = F

    +

    l e a d i n g t o a c o n t r a d i c t i o n o f t h e f a c t t h a t F i s m i n i m u m . T h e r e s u l t n o w f o l l o w s

    b y D e n i t i o n 1 8 . 2

    T h e f o l l o w i n g t h e o r e m i s t h e c o m p a n i o n r e s u l t t o T h e o r e m 1 5 .

    T h e o r e m 2 5 . I f a s e t o f F D s F i s a n n u a l t h e n i t i s a l s o o p t i m u m .

    P r o o f . L e t # L H S ( F ) d e n o t e t h e s u m ,

    P

    X ! Y 2 F

    X , a n d # R H S ( F ) d e n o t e t h e

    s u m ,

    P

    X ! Y 2 F

    Y . B y T h e o r e m 2 1 , # L H S ( F ) = # L H S ( G ) , w h e r e G i s a n

    o p t i m u m c o v e r o f F . I t r e m a i n s t o s h o w t h a t # R H S ( F ) = # R H S ( G ) .

    B y L e m m a 7 F i s o p t i m u m i f a n d o n l y i f a l l t h e e q u i v a l e n c e c l a s s e s o f F a r e o p t i -

    m u m . L e t E

    F

    ( X ) b e a n e q u i v a l e n c e c l a s s o f F f o r s o m e X s c h ( R ) . B y L e m m a 2 4

    w e c a n a s s u m e t h a t E

    F

    ( X ) h a s t h e f o r m f X

    1

    ! Y A

    1

    ; : : : ; X

    n

    ! A

    n

    g w i t h Y =

    A C Y ( X ) . T h u s w e n e e d t o s h o w t h a t # R H S ( E

    F

    ( X ) ) = # R H S ( E

    G

    ( X ) ) .

    A s s u m e t h a t E

    F

    ( X ) i s n o t o p t i m u m a n d t h a t E

    G

    ( X ) = f X

    1

    ! W A

    1

    ; : : : ; X

    n

    !

    A

    n

    g i s a n o p t i m u m e q u i v a l e n c e c l a s s o f G , w i t h W

  • 8/3/2019 Levene Loizou Incomplete Relations

    21/43

    D a t a b a s e D e s i g n f o r I n c o m p l e t e R e l a t i o n s 2 1

    C o r o l l a r y 2 6 . A n o p t i m u m c o v e r o f a s e t o f F D s F o v e r R t h a t s a t i s e s t h e

    s p l i t - f r e e n e s s p r o p e r t y c a n b e f o u n d i n p o l y n o m i a l t i m e i n t h e s i z e o f F .

    P r o o f . T h e r e s u l t i s a d i r e c t c o n s e q u e n c e o f L e m m a 2 4 a n d T h e o r e m 2 5 . 2

    T h e n e x t e x a m p l e s h o w s t h a t a r e s u l t c o r r e s p o n d i n g t o T h e o r e m 1 7 d o e s n o t

    h o l d w h e n F s a t i s e s t h e s p l i t - f r e e n e s s p r o p e r t y ; t h a t i s , F m a y h a v e m o r e t h a n

    o n e o p t i m a l c o v e r .

    E x a m p l e 3 . L e t R b e a r e l a t i o n s c h e m a , w i t h s c h ( R ) = f A , B , C g a n d l e t F =

    f A ! C B ! C C ! B g . I t c a n e a s i l y b e v e r i e d t h a t F i s o p t i m u m a n d t h a t F

    s a t i s e s t h e s p l i t - f r e e n e s s p r o p e r t y . N o w , l e t G = f A ! B B ! C C ! B g a n d

    t h u s G 6= F . I t c a n a l s o e a s i l y b e v e r i e d t h a t G i s a c o v e r o f F a n d t h a t G i s a l s o

    o p t i m u m .

    6 . 3 T h e s t r u c t u r e o f m o n o d e p e n d e n t s e t s o f F D s w h i c h a r e o p t i m u m

    H e r e i n w e g i v e s o m e m o r e t e c h n i c a l r e s u l t s w h i c h h e l p u s t o u n d e r s t a n d t h e s t r u c -

    t u r e o f m o n o d e p e n d e n t s e t s o f F D s w h i c h a r e a l s o o p t i m u m . F r o m n o w o n w e w i l l

    a s s u m e , u n l e s s i t i s s t a t e d o t h e r w i s e , t h a t F i s a s e t o f m o n o d e p e n d e n t F D s o v e r

    R

    L e m m a 2 7 . L e t F b e m o n o d e p e n d e n t a n d o p t i m u m , a n d X ! Y W ! Z b e

    d i s t i n c t F D s i n E

    F

    ( X ) , f o r s o m e X s c h ( R ) . T h e n X = W X \ W = X ? 1 a n d

    Y = Z = 1

    P r o o f . B y L e m m a 2 0 X = W a n d b y L e m m a 2 2 X \ W = X ? 1 . A s s u m e t o

    t h e c o n t r a r y t h a t Y > 1 ; a s y m m e t r i c a r g u m e n t c a n b e u s e d i f w e a s s u m e t h a t

    Z > 1 . B y L e m m a 1 4 , w e h a v e t h a t Y W . T h e r e s u l t f o l l o w s , s i n c e w e a r r i v e a t

    t h e c o n t r a d i c t o r y c o n c l u s i o n t h a t X \ W X ? 2 , d u e t o t h e f a c t t h a t X \ Y =

    ; 2

    T h e f o l l o w i n g c o r o l l a r y i s a n i m m e d i a t e c o n s e q u e n c e o f L e m m a 1 4 a n d L e m m a 2 7 .

    C o r o l l a r y 2 8 . L e t F b e m o n o d e p e n d e n t a n d o p t i m u m , a n d X ! Y W ! Z

    b e F D s i n E

    F

    ( X ) , f o r s o m e X s c h ( R ) . T h e n X Y = W Z . 2

    L e m m a 2 9 . L e t F b e m o n o d e p e n d e n t a n d o p t i m u m a n d l e t X ! Y W ! Z 2

    F b e F D s s u c h t h a t E

    F

    ( X ) 6= E

    F

    ( W ) . T h e n

    ( 1 ) X 6= W a n d Y \ Z = ;

    ( 2 ) Y \ W = ; a n d X \ Z = ;

    P r o o f . T h e r s t p a r t f o l l o w s f r o m L e m m a 1 3 . F o r t h e s e c o n d p a r t w e s h o w t h a t Y

    \ W = ; ; a s y m m e t r i c a r g u m e n t c a n b e u s e d t o s h o w t h a t X \ Z = ; . A s s u m e t o

    t h e c o n t r a r y t h a t A 2 Y \ W . B y L e m m a 1 3 i t f o l l o w s t h a t Y W a n d Z X

    W e n o w c l a i m t h a t i t i s a l s o t h e c a s e t h a t X a n d W a r e i n c o m p a r a b l e . W e a l r e a d y

    h a v e t h a t X 6= W b y t h e r s t p a r t . S o a s s u m e t h a t X W ; a s y m m e t r i c a r g u m e n t

    c a n b e u s e d i f w e a s s u m e t h a t W X . I t f o l l o w s t h a t Z W , s i n c e Z X . T h u s

    W ! Z i s a t r i v i a l F D , c o n t r a d i c t i n g t h e f a c t t h a t F i s o p t i m u m .

  • 8/3/2019 Levene Loizou Incomplete Relations

    22/43

    2 2 M . L e v e n e a n d G . L o i z o u

    S o f a r , o n a s s u m i n g t h a t A 2 Y \ W , w e h a v e t h a t Y W Z X a n d t h a t X

    a n d W a r e i n c o m p a r a b l e . T h u s 9 A 2 Y \ W 9 B 2 X \ Z , s u c h t h a t X ! A a n d

    W ! B 2 F

    +

    a r e c y c l i c a n d r e d u c e d F D s . T h e r e f o r e b y L e m m a 1 9 w e c a n r e w r i t e

    X ! A a s V B ! A a n d W ! B a s V A ! B . H o w e v e r , t h i s c o n t r a d i c t s t h e f a c t

    t h a t E

    F

    ( X ) 6= E

    F

    ( W ) . T h e r e f o r e , b y L e m m a 1 3 i t m u s t b e t h e c a s e t h a t Y \ W

    = ; a n d t h a t X \ Z = ; a s r e q u i r e d . 2

    W e c l o s e t h i s s u b s e c t i o n b y s h o w i n g t h a t s e t s o f F D s w h i c h a r e m o n o d e p e n d e n t

    a n d o p t i m u m a r e c l o s e d u n d e r t h e p r o p e r s u b s e t o p e r a t i o n .

    L e m m a 3 0 . L e t F b e a m o n o d e p e n d e n t a n d o p t i m u m s e t o f F D s . T h e n 8 G

    F , G i s a m o n o d e p e n d e n t a n d o p t i m u m s e t o f F D s o v e r R .

    P r o o f . L e t G F . B y L e m m a s 2 9 a n d 2 7 , a n d C o r o l l a r y 2 8 w e c a n d e d u c e t h a t X

    ! A 2 F

    +

    a n d A 2 Z f o r s o m e F D W ! Z 2 G i f a n d o n l y i f X ! A 2 G

    +

    . W e c a l l

    t h i s s t a t e m e n t O b s e r v a t i o n 1 . T h e r e f o r e , G m u s t s a t i s f y t h e i n t e r s e c t i o n p r o p e r t y ,

    s i n c e o t h e r w i s e t h e r e m u s t e x i s t i n c o m p a r a b l e F D s X ! A Y ! A 2 G

    +

    , b u t X \

    Y ! A 2 F

    +

    ? G

    +

    , w h i c h c o n t r a d i c t s O b s e r v a t i o n 1 . S i m i l a r l y , G m u s t s a t i s f y t h e

    s p l i t - f r e e n e s s p r o p e r t y , s i n c e o t h e r w i s e t h e r e m u s t e x i s t c y c l i c F D s , X B ! A , Y A

    ! B 2 G

    +

    , b u t e i t h e r Y ! B 2 F

    +

    ? G

    +

    o r ( X \ Y ) A ! B 2 F

    +

    ? G

    +

    , w h i c h

    a g a i n c o n t r a d i c t s O b s e r v a t i o n 1 .

    N e x t , s u p p o s e t h a t G i s n o t o p t i m u m a n d t h a t H i s a n o p t i m u m c o v e r o f G , w i t h

    H

  • 8/3/2019 Levene Loizou Incomplete Relations

    23/43

    D a t a b a s e D e s i g n f o r I n c o m p l e t e R e l a t i o n s 2 3

    D e f i n i t i o n 2 0 . T h e s e t o f e x t r e m e a t t r i b u t e s w i t h r e s p e c t t o a s e t o f F D s F ,

    d e n o t e d b y E X T ( F ) , i s d e n e d b y

    E X T ( F ) = f A 6 9 W ! Z 2 F s u c h t h a t A 2 Z ? W g

    I t c a n e a s i l y b e v e r i e d t h a t f o r a l l k e y s , X f o r R w i t h r e s p e c t t o F , E X T ( F )

    X h o l d s .

    T h e o r e m 3 1 . L e t F b e m o n o d e p e n d e n t a n d o p t i m u m , a n d l e t E = f E

    F

    ( X

    1

    ) ; : : : ; E

    F

    ( X

    k

    ) g

    b e t h e s e t o f a l l n o n e m p t y e q u i v a l e n c e c l a s s e s o f F . T h e n X s c h ( R ) i s a k e y f o r

    R i f a n d o n l y i f X = E X T ( F )

    S

    k

    i = 1

    Y

    i

    , w h e r e 8 i 2 f 1 ; : : : ; k g Y

    i

    ! Z

    i

    2 E

    F

    ( X

    i

    )

    P r o o f . I f . L e t V = s c h ( R ) ? X a n d s u p p o s e t h a t Y =

    S

    k

    i = 1

    Y

    i

    , w h e r e Y

    i

    ! Z

    i

    2

    E

    F

    ( X

    i

    ) . W e r s t s h o w t h a t X ! V 2 F

    +

    a n d t h u s X ! s c h ( R ) 2 F

    +

    . L e t A 2 V

    a n d t h u s 9 W ! Z 2 F s u c h t h a t A 2 Z . M o r e o v e r , b y t h e d e n i t i o n o f Y , E

    F

    ( W )

    = E

    F

    ( Y

    i

    ) f o r s o m e Y

    i

    Y X . I t f o l l o w s t h a t Y

    i

    ! A 2 F

    +

    a n d t h u s X ! A

    2 F

    +

    a s r e q u i r e d .

    I t r e m a i n s t o s h o w t h a t 8 A 2 X , ( X ? A ) ! s c h ( R ) 62 F

    +

    . T h e r e a r e t w o c a s e s t o

    c o n s i d e r . I n t h e r s t c a s e , w h e n A 2 E X T ( F ) , t h e r e s u l t f o l l o w s b y t h e d e n i t i o n

    o f E X T ( F ) , s i n c e ( X ? A ) ! A 62 F

    +

    . I n t h e s e c o n d c a s e , w h e n A 2 Y ? E X T ( F ) ,

    a s s u m e t o t h e c o n t r a r y t h a t ( X ? A ) ! A 2 F

    +

    . T h u s A 2 Y

    i

    f o r s o m e Y

    i

    Y

    X , w i t h Y

    i

    ! Z

    i

    2 E

    F

    ( Y

    i

    ) . I t f o l l o w s t h a t ( X ? A ) ! Z

    i

    2 F

    +

    a n d , s i n c e F s a t i s e s

    t h e i n t e r s e c t i o n p r o p e r t y , i t a l s o f o l l o w s t h a t ( Y

    i

    ? A ) ! Z

    i

    2 F

    +

    , d u e t o t h e f a c t

    t h a t ( X ? A ) \ Y

    i

    = Y

    i

    ? A . ( N o t e t h a t X ? A Y

    i

    i s n o t p o s s i b l e , o t h e r w i s e w e c a n

    d e r i v e a c o n t r a d i c t i o n o f t h e f a c t t h a t F i s o p t i m u m . )

    B y L e m m a 1 0 , 8 B 2 Z

    i

    Y

    i

    ! Z

    i

    2 F i s t h e u n i q u e F D s u c h t h a t B 2 Z

    i

    T h e r e f o r e , b y P r o p o s i t i o n 4 ( Y

    i

    ? A ) ! Y

    i

    2 ( F ? f Y

    i

    ! Z

    i

    g )

    +

    . I t f o l l o w s t h a t F i s

    n o t o p t i m u m , s i n c e w e