CeBIT 2013, Hannover ECM-Forum „Shared Content“ Content & Kontext - Wertsteigerung für Informationen. Lösungen & Praxisbeispiele Franz Kögl – IntraFind Software AG 05.03.2013, 10:30 Uhr
CeBIT 2013, Hannover ECM-Forum „Shared Content“
Content & Kontext - Wertsteigerung für Informationen. Lösungen &
Praxisbeispiele
Franz Kögl – IntraFind Software AG
05.03.2013, 10:30 Uhr
ENTERPRISE SEARCH
EINHEITLICHER ZUGANG ZU ALLEN
INFORMATIONEN ÜBER EINEN ZENTRALEN
INDIZIERUNGS- UND SUCHSERVICE
© IntraFind Software AG, 2013 2
Enterprise Search: Single Point Of Information Access
© IntraFind Software AG, 2013 3
File Shares
(Win, Unix) E-Mail
DMS &
Archive
Applications
ERP/CRM
+ weitere Quellen…
iFinder
Enterprise Search
Konnektoren
PDM / PLM Intranet /
Internet
Wikis &
Collabo-
ration
Suche & Wissensmanagement – Spektrum: von Simple Search bis Knowledge Cockpits
© IntraFind Software AG, 2013 4
Suche & Wissensmanagement – Einstieg über Dashboard
Widgets:
Gespeicherte Suchen
Meine favorisierten Dokumente
Alerts
News
…
© IntraFind Software AG, 2013 5
Suche & Wissensmanagement – Intelligente Autovervollständigung
© IntraFind Software AG, 2013 6
AUTOMATISCHE
VERSCHLAGWORTUNG:
TAGGING SERVICE
© IntraFind Software AG, 2013 7
Verschlagwortungsarten
Freie Verschlagwortung
Extraktion von Sachverhalten aus dem Dokumenteninhalt
Kontrollierte Verschlagwortung
Freie Schlagworte werden mit einem kontrollierten Vokabular / Thesaurus / Wissensnetz abgeglichen
Entitätenerkennung
Erkennung der Eigennamen von Personen, Organisationen, Orten
Themenerkennung
mittels automatischer Textklassifikation (Lernverfahren) bei gegebenen Themenhierarchien
© IntraFind Software AG, 2013 8
Tagging Service – Produktfunktionalitäten
Konfigurierbares Komplettpaket mit RESTful-API
Für Nutzung als Cloud-Service oder für On-Premise-Installationen
Index ist ein generisches Metadaten-Repository
© IntraFind Software AG, 2013 9
Freie Schlagworte
Named Entities
Standardentitäten
Whitelisting
Kontrolliertes
Vokabular
Wissensnetz
Spezielle Entitäten
domänen- oder
kundenspezifisch
Themenerkennung
Training über
Training Wizard
Basis Individuell
Erkennung Freier Schlagworte
Erkennung wichtiger Begriffe eines Dokuments
Erkennung von Begriffen, die im Dokument „wichtig“ sind und im restlichen Korpus „weniger wichtig“
Abgleich (Matching) mit einem kontrollierten Vokabular / einer „Whitelist“
© IntraFind Software AG, 2013 10
Erkennung von Eigennamen
© IntraFind Software AG, 2013 11
Automatische Extraktion von Kern-informationen aus unstrukturierten Daten
Eigennamen von Personen
Eigennamen von Firmen
Marken aus Produktlisten
Technische Kennzahlen aus technischen Daten
(Raw Materials, Produkttypen, Bestellnummern,
Prozessnummern, eClass Kategorien)
Straßen- Ortsbezeichnungen
Währungs- und Buchhaltungswerte
Datumsangaben
Telefonnummern, E-Mail-Daten, Hyperlinks
Topic Learner Classifier
Rules (Parameters)
Definition of
Topics 1……N
Topic Classifier
Topic Association
Learning Phase
Classification Phase
New Document
Example Documents
Erkennung von Themen – mit Textklassifikation
© IntraFind Software AG, 2013 12
Erkennung von Themen – mit Textklassifikation
New documents / content
Step 1: Topic Analysis
Step 2: Topic Matching
High accuracy
Scalable
Large scale analysis
Up to 5000 nodes
© IntraFind Software AG, 2013 13
Topic
1
Topic
1.1
Topic
1.2
Topic
1.2.1
Topic
1.2.2
Topic
2
Topic
3
Taxonomy
Topic
1.2.2
Fazit: Viele komplexe Verfahren – ein einfacher Arbeitsschritt
© IntraFind Software AG, 2013 14
Entity: Top Term 1
Entity: Person Name
Entity: Location
Entity: Top Term 2
Entity: Company Name
Entity: Top Term 3
Metadaten-Store
(Index, Redaktionssystem, semantisches Netz)
Entity / Category
Document
Document
AUS DER PRAXIS:
KUNDENPROJEKTE
© IntraFind Software AG, 2013 15
Text Analytics – Skills & Wer macht was?
Welche Rolle haben Personen in Unternehmen?
Sie arbeiten in bestimmten Projekten
Sie sind Experten für bestimmte Themen
Lösung:
Erkennen von Skills
Erkennen von Projekten
Erkennen von Personennamen, mit Abgleich zum Active Directory
Normalisierung der Eigennamen
Analyse des E-Mails-Verkehrs
Automatisierte Informationen zu Projektbeteiligten, Skills und zu „Wen könnte ich fragen?“
Bis hin zur Analyse von Lebensläufen bei einem Personalvermittlungsdienstleister
Verbesserung des zentralen Geschäftsprozesses / des Abgleichs von
Kandidatenprofilen zu offenen Stellenbeschreibungen
© IntraFind Software AG, 2013 16
ZEIT ONLINE: Verbesserung von Redaktionsprozessen
Darstellung der Lösung – der ZEIT-Tagger
Verbesserung des Content-Erstellungsprozesses
Automatische Verschlagwortung:
Qualitativ hochwertige Vorschläge für den Redakteur; mit intellektueller Qualitätssicherung
Durch Anwendung folgender Verfahren:
TopTerm-Analyse,
Themenerkennung,
Entitätenerkennung,
Content-Verlinkung
Aufbau eines kontrollierten Vokabulars aus dem ZEIT-Archiv für eine höhere Wertung der
erkannten Tags / freien Schlagworte
Vorsystem Wissensnetz
Ablösung wegen hohem Pflegeaufwand und geringer interner Expertise
© IntraFind Software AG, 2013 17
ZEIT ONLINE: Verbesserung von Redaktionsprozessen
Lösung:
Suche: Qualitativer Ausbau der Solr-Installation im Portal mit Linguistik
Verschlagwortung: Qualitativ hochwertige Vorschläge für den Redakteur
Themenerkennung, Entitätenerkennung, Content-Verlinkung
Definition von Themenspecials
SEO / Optimierungsvorschläge
© IntraFind Software AG, 2013 18
Nutzen für ZEIT ONLINE
Erhöhte Zugriffe auf www.zeit.de durch
Optimierung der Volltextsuche qualitativ bessere Suchergebnisse
Bessere Verlinkung der Artikel durch Related Links
Schlagwort- und Registerseiten
Klickoptimierung und Zeitersparnis durch automatische Verschlagwortung
Bessere Recherchemöglichkeit intern für die Mitarbeiter in der Redaktion
© IntraFind Software AG, 2013 19
Das lieferte unser Produkt so nebenbei…
© IntraFind Software AG, 2013 20
http://blog.zeit.de/open-data/2012/12/31/personen_jahresrueckblick_2012/
Produktdatensuche
Produkte besser auffindbar machen
Normalisierung der Produktdaten
Normalisierung auf SI-Einheiten
Suche in Wertebereichen
Verbesserte Datenqualität
Höherer Suchkomfort durch
Rubrizierte Autovervollständigung
Interpretation der Suchanfrage
© IntraFind Software AG, 2013 21
Bestehende „Altdaten“ nutzbar machen
Ausgangssituation:
Neuer Collaboration Workplace löst unternehmensweite Intranetplattform ab
Automatischer Verschlagworter analysiert sämtliche bestehenden Unternehmensdaten des
File-Systems
Erzeugt mittels eines kontrollierten Vokabulars eine einheitliche Metadatensystematik aller
Inhalte
Schlagworte: „Top-Terme“ eines Dokuments, Entitäten + Thema (gemäß
kundenspezifischer Taxonomie)
Kontextbezogene Vernetzung der Inhalte
Zuordnung zu aktuellen Projekt-Teamsites
© IntraFind Software AG, 2013 22
Wolters Kluwer Deutschland – JURION: Datenquellenübergreifende Metadaten
Zu jedem Informationsobjekt im JURION-Wissensraum werden einheitliche Themen-
Metadaten erzeugt
Referenz: WKD –Rechtsgebiete-Taxonomie mit derzeit ca. 100 Knoten
© IntraFind Software AG, 2013 23
Zentrale Inhalte
Wolters Kluwer Deutschland – JURION: Intelligente Suche für den Anwender
© IntraFind Software AG, 2013 24
Wissenslandkarten bei Voith: Suche über Metadaten
© IntraFind Software AG, 2013 25
Wissenslandkarten bei Voith: SAP-Anbindung
© IntraFind Software AG, 2013 26
IntraFind Software AG
IntraFind entwickelt Produkte rund um das effiziente Suchen, Finden, Analysieren von Informationen
unter Berücksichtigung aller Datenquellen eines Unternehmens.
Kundenbasis in
Deutschland, Österreich und Schweiz
Kunden: >850
Mitarbeiter: 30
Gründung: Jahr 2000 in München
Unabhängiger Anbieter von Suchlösungen
basierend auf Lucene, Solr und ElasticSearch
Lieferung von Best-of-Breed-Produkten
Volltextsuche und die komplette Bandbreite an Textanalyseverfahren bilden die Grundlage für eine optimale
Ergebnisdarstellung. Mehr Informationen: www.intrafind.de
27
Kontakt
© IntraFind Software AG, 2013 28
Franz Kögl
Vorstand
Tel: +49 (89) 3090446-0
Fax: +49 (89) 3090446-29
E-Mail: [email protected]
Web: www.intrafind.de
IntraFind Software AG
Landsberger Straße 368
80687 München
Besuchen Sie uns am VOI-Stand: Halle 3, D34/1
CeBIT 2013, Hannover ECM-Forum „Shared Content“
Vielen Dank für Ihr Interesse!
Weitere Informationen unter: www.ecm-navigator.de
und www.ecmtoday.de