12.10.2018 | Interview

Proof of Concept - Machine Learning

Das Interview mit Dr. Christian Winkler und Stephanie Fischer hat es in sich. Die Algorithmen von datanizing analysieren riesige Textmengen und tragen somit dazu bei, Trends zu entdecken, richtige Inhalte zu erstellen oder diese mit anderen Inhalten anzureichern. Ein beeindruckender Use Case mit vielen konkreten Anwendungsfällen. 

Hallo Steffi, hallo Christian! Die heutigen Datenmassen schnell und effektiv zu bewältigen, ist eines eurer Ziele bei datanizing. Zum Einstieg erklärt doch bitte, um was geht's denn eigentlich bei datanizing?

Steffi:

Christian und ich haben datanizing in 2017 mit Sitz in München gegründet. Unsere Vision ist es, riesige Textmassen für den Menschen analysierbar und leicht zugänglich zu machen.

Der Kern von datanizing ist ein Textanalyse Service namens NIZE.  NIZE haben wir entwickelt, um Texte jeglicher Art automatisiert zu analysieren. Mit diesem Tool kannst Du die reine Texterfassung abhandeln, aber auch Texte bereinigen, diese mit Zusatzinfos anreichern oder das Ganze visuell in einem Dashboard darstellen und zusammenfassen. Das Ganze passiert automatisiert. Machine Learning spielt dabei eine wichtige Rolle.

NIZE kommt bei der automatisierten Analyse sehr unterschiedlicher Datenquellen zum Einsatz: Von der Analyse von Produktreviews nach neuen Trends und Kundenbedürfnissen, über die Analyse von Anforderungsdokumenten zum automatisieren Projektcontrolling und die Klassifikation von Verträgen nach rechtlichen Grundlagen.

Ein weiteres Einsatzgebiet hat NIZE in der professionellen Marktforschung gefunden. Das Tool wertet viele Hunderttausende nutzergenerierter Texte im Netz aus. Das ist datengetriebene Marktforschung!

 

Christian: 

Bei der Entwicklung von NIZE haben wir großen Wert darauf gelegt, dass die Werkzeuge, Frameworks und Machine Learning Algorithmen, exakt aufeinander abgestimmt sind. Was nicht zu 100% unseren Anforderungen genügt hat, haben wir selbst entwickelt. Somit konnten wir mit NIZE einen Service entwickeln, der seines Gleichen sucht.

Bei den bisher verfügbaren Lösungen zur automatisierten Textanalyse, handelt es sich in erster Linie um technische Dienstleistungen, meist amerikanischer Unternehmen, die - abgesehen vom Datenschutz - nicht auf eine hohe Automatisierung und Nutzerfreundlichkeit oder gar auf den Endbenutzer ausgelegt sind.

Machine Learning innerhalb der Textanalyse.

Das sind echte USPs, die sich viele Unternehmen wünschen würden. Wie kommt ihr auf dieses Thema und wo liegen eure Wurzeln?

Christian:

Ich bin Data Scientist und Machine Learning Architect. Ursprünglich habe ich in theoretischer Physik promoviert. Seit 20 Jahren bin ich jetzt im Bereich großer Datenmengen und künstlicher Intelligenz unterwegs. In dieser Zeit habe ich meinen Fokus mehr und mehr auf skalierbare Systeme und intelligente Algorithmen für die Massentextverarbeitung gelegt...das interessiert mich einfach!

Steffi:

Ich habe Erfahrung im Bereich datengetriebener Innovation, insbesondere wenn es darum geht, maschinelles Lernen auf Text anzuwenden. Vor datanizing war ich viele Jahre als Unternehmensberaterin im Bereich Innovation und Machine Learning tätig und habe einen Hintergrund in Organisationsentwicklung.

 

Christian:

Vor der Gründung von datanizing haben Steffi und ich im selben Unternehmen gearbeitet. Wir sind beide viel interessierte Menschen und hatten ein gemeinsames Problem, das bestimmt viele kennen: Zu viele interessante Artikel, Nachrichten, Blogposts und gleichzeitig zu wenig Zeit, alle durchzulesen. Wir fingen an, mit den Texten unserer bevorzugten Online-Nachrichten und Blogs zu experimentieren, mit dem Ziel, die wichtigsten Erkenntnisse durch Machine Learning automatisch abzuleiten um nicht alles Zeile für Zeile selbst zu lesen zu müssen. Zuerst haben wir das nur für uns gemacht, dann auch für ein paar unserer damaligen Kolleginnen und Kollegen. Irgendwann hatten wir die ersten Kundenprojekte. In 2017 haben wir beschlossen, mit diesem Erfahrungsschatz im Gepäck ein Unternehmen zu gründen.

Dr. Christian Winkler und Stephanie Fischer sind datanizing.

Ihr seid also Überzeugungstäter und habt eure Leidenschaft zum Geschäft gemacht. Machine Learning und KI sind ja gerade in aller Munde. Wo seht ihr die größten Potentiale für eure Technologie?

Christian:

Bisher ungenutzte große, spezialisierte Textmassen können mit NIZE automatisiert und regelmäßig analysiert werden. Das NIZE Dashboard präsentiert verschiedene Quelldaten in einer einzigen Oberfläche und macht die Einsichten mithilfe interaktiver Widgets leicht verständlich. Bisher unüberschaubare Textmassen werden somit verständlich, Muster und Trends werden sichtbar.

Steffi:

Ein konkretes Beispiel, wie NIZE für die Marktforschung zum Einsatz kommt: In diesem Bereich ergeben sich dank der NIZE Textanalyse-Technologien ganz neue Möglichkeiten: 

Wir haben Algorithmen entwickelt, die - basierend auf der konkreten Fragestellung – automatisiert die dafür relevanten Inhalte im Internet sammeln. Anschließend ranken Algorithmen dieses Ergebnis nach Relevanz, berechnen die datengetriebenen Erkenntnisse und zeigen sie in einem Dashboard an. 

Mit dieser Art der datengetriebenen Marktforschung können Unternehmen für sie relevante Trends und Nutzergruppen kontinuierlich – praktisch individualisiert - verfolgen. Dadurch verstehen sie besser die unterschiedlichen Bedürfnisse der Zielgruppen über die Zeit – um Serviceangebote auf Orte zu personalisieren, Marketingbotschaften für unterschiedliche Nutzergruppen zu personalisieren, kurzfristige Trends für das Category Management abzuleiten oder sich mit den eigenen Wettbewerbern zu benchmarken.

Machine Learning ist Teil der künstlichen Intelligenz.

Wenn ich jetzt mal aus der Perspektive unseres Netzwerks Frage: wo seht ihr die interessantesten Potentiale und die berühmten „Low Hanging Fruits“ bzgl. Contentanalyse auf Websites mit Hilfe von KI?

Steffi:

Unsere Technologien unterstützen z.B. Redakteure heute schon dabei, datengetrieben die Themen zu finden, über die es sich zu schreiben lohnt. Dazu aggregiert unser NIZE-Dashboard die Blog-Beiträge, User-Kommentare etc. aus unterschiedlichen (auch sehr umfangreichen) Internetquellen. Das können z.B. das eigene Forum und weitere für das eigenen Unternehmen relevante News-Sites sein. Mit Hilfe von Machine Learning werden dann langfristige Trends und kurzfristige Hypes innerhalb dieses Contents automatisiert erkannt und dargestellt. Was die Community bewegt (bzw. eben auch nicht mehr bewegt), wird so sehr schnell sichtbar und ist ständig aktuell. Mit diesen datengetriebenen Infos entscheiden sich die Redakteure, welche Trends sie aufgreifen wollen, welche nicht. Das heißt die Entscheidung bleibt weiterhin in der Hand des Menschen, wird aber auf die Bedürfnisse/Meinungen der Zielgruppe personalisiert. Redakteure werden dadurch effizienter und können sich auf den kreativen Teil ihrer Arbeit konzentrieren. Langwierige Recherche kann z.T. durch Algorithmen übernommen werden.

Christian:

"Customized Content Creation” ist schon in den ersten Zügen vorhanden und wird mit Sicherheit noch an Bedeutung gewinnen. Dabei geht es um ganz unterschiedliche Aspekte.

Die automatisierte Generierung von News mit Hilfe von Machine Learning wird bisher nur in speziellen Bereichen eingesetzt - z.B. bei Sport- oder Wettermeldungen. Datenbasierte Stichworte zu aktuellen Themen können bereits heute ausgeliefert und dann von Redakteuren manuell zu Fließtexten ergänzt werden - auch das ist häufig bereits eine große Arbeitserleichterung. Es gibt auch erste Initiativen zum automatischen Schreiben von literarischen Texten – mit sehr gemischten Ergebnissen. Das wird aber nicht so bleiben...(schmunzelt).

Wie wird das weitergehen? Wie wird eurer Meinung nach KI die Digitalbranche mittelfristig verändern? Was sind die großen Trends, die ihr seht?

Steffi:

Repetitive Arbeiten werden mehr und mehr an Maschinen übergeben. Menschen werden sich in Zukunft viel stärker auf Aufgabenfelder konzentrieren, die Kreativität oder Empathie erfordern. Das wird zu kooperativen Arbeitsmodellen von Mensch und Maschine führen. Dieser Trend ist branchenübergreifend und unaufhaltsam.

Christian: 

Intelligente Algorithmen werden für mehr Repräsentativität in der Entscheidungsfindung genutzt werden. Noch ist es nicht zu spät – wer jetzt damit anfängt, die Potentiale von KI für sich und sein Geschäft zu erschließen, kann sich auch heute noch Wettbewerbsvorteile sichern.

Vielen Dank euch beiden und weiterhin viel Erfolg mit datanizing!