Automatic Content Content Seeding Content-Erstellung Texten

Wie aus Daten neue Texte werden

Was kann Automatic Unique Content

In diesem Beitrag beschreiben wir einen Weg, mit dem Sie aus vorhandenen Daten neue und einzigartige Texte automatisiert erstellen lassen können.

Mit der Beschreibungs-Sprache ATML3 können Sie Texte in Deutsch, Englisch und 11 weiteren Sprachen (darunter auch Japanisch und Chinesisch) erstellen.

Automatisch erstellter Content

Automatisch erstellter Content

Daten können für die nachfolgenden Beispiele echte Datenbanken sein (z.B. Oracle, Google Analytics oder Datev). Genauso kommen strukturierte Daten in Form von Excel-Dateien bzw. Excel Tabellen in Betracht. In einigen Fällen können sogar CSV-Dateien ausreichend sein.

Grundlegend ist, dass die zu verarbeitenden Datenzeilen immer in der gleichen Struktur vorliegen.

Warum ist einzigartiger Text im Web so wichtig?

Wer auf seiner Webseite, in seinen E-Commerce Shop oder in seinem Blog viel zu sagen bzw. viel zu schreiben hat, der ist im Content Marketing der ausgesprochene Liebling des Suchmaschinen-Giganten Google. Texte, die weniger als 400 Wörter haben, erzielen in den bekannten Suchmaschinen wie Google oder Bing nur noch in ausgesprochen seltenen Fällen nennenswerte Rankings.

Darüber hinaus ist es aus Sicht der Suchmaschine von Nachteil, wenn Webseitenbetreiber Texte verwenden, die bereits an anderer Stelle im Web verwendet worden sind. Dieser so genannte „duplicate content“ ist häufig ein Plagiat und aus Sicht der Suchmaschine im Internet schlicht überflüssig.

Betreiber von großen Webseiten müssen daher häufig bereits andernorts verwendete Inhalte umschreiben oder neu texten lassen, wenn Sie nicht Gefahr laufen wollen, dass die Sichtbarkeit ihrer Webseite leidet.

Wofür ist die automatische Text-Erstellung gedacht?

Mit der automatischen Texterstellung wird der schreibende und recherchierende Redakteur nicht überflüssig gemacht. In der Regel wird die automatisierte Erstellung von „Unique Content“ dort eingesetzt, wo es entweder bisher nicht wirtschaftlich war Texte zu erstellen.

Wie Sie in 5 Schritten aus Ihren Daten automatisch einzigartige Texte erstellen. Hier erfahren Sie mehr …

Wer beispielsweise auf einmal zehn oder 20 Texte für ähnliche Schuhe pro Tag erstellt hat, wird möglicherweise nicht mehrere Tage oder gar Wochen hintereinander 500 Paar unterschiedliche Schuhe betexten wollen.

Grundsätzlich gibt es viele denkbare Einsatzzwecke für Unique Content:

  • Webshops:
    Wo viele ähnliche Texte immer wieder benötigt werden und häufig auch nach gleichem Muster wirtschaftlich sinnvoll erstellt werden müssen. Etwa Produkt-Texte oder Beschreibungen von Kategorien
  • eCommerce Plattformen:
    Unique Content aus Wetterdaten

    Unique Content aus Wetterdaten

    An den Stellen, an denen sich Betreiber von E-Commerce Plattformen nur durch zusätzliche, eigene Inhalte (i.d.R. unique content) von ihren Mitbewerber unterscheiden können

  • Ungenutzte Datenquellen:Wo bestehende Daten bisher gar nicht genutzt wurden und damit zum ersten Mal in sprachlicher Form ausgewertet und dargestellt werden sollen. Z.B. die Aufbereitung von Wetter-Daten.

Abgrenzung zum Text-Spinning

Die Erstellung von Automatic Unique Content wird gelegentlich mit dem so genannten Text-Spinning oder Spin-Rewriting verwechselt. Beim Text-Spinning werden bestehende Texte solange durch Synonyme angereichert bis eine scheinbar beliebig hohe Anzahl an unterschiedlichen Texten mit Hilfe einer Software erstellt werden kann.

Die daraus resultierenden Texte werden häufig bei der Suchmaschinen-Optimierung (SEO) verwendet. In aller Regel leidet beim Content- oder Artikel-Spinning aber die Lesbarkeit der Texte erheblich. Daher wird das Spinning selten auf Webseiten mit einer hohen Besucher-Anzahl und praktisch nie in Printmedien vorkommen.

Automatic Unique Content geht weit über das Umschreiben bzw. Text-Spinning hinaus. Es wird hier nicht nur eine eigene Beschreibungs-Sprache verwendet. Die eingesetzte Technologie berücksichtigt neben den Daten, die daraus entstehenden Abhängigkeiten (zwischen Texten) sowie logische Bedingungen. All das wird anschließend in einen semantischen Text gegossen.

Wie genau bei der Erstellung von „Automatic Unique Content“ vorgegangen wird und welche Konsequenzen dies hat, erläutern wir nachfolgend.

Wer von automatischer Text-Erstellung profitieren kann

Von der automatisierten Erstellung von Content können unterschiedlichste Anwender bzw. Betreiber profitieren:

  • Betreiber von Webshops E-Commerce Plattformen, die regelmäßig Produkttexte von Produkten, Waren oder Dienstleistungen in ähnlichen Produktkategorien betexten lassen müssen.
  • Betreiber von großen Onlineplattformen (Nachrichtenseiten, Zeitungen, Portalen), die aus unterschiedlichen Quellen immer wieder ähnliche Daten in natürliche, lesbare Sprache verwandeln.
  • Anbieter von Informationsdiensten (Börsendaten, Wetter-Informationen), die aus Ihren Daten beispielsweise einen individuellen Börsenbericht erstellen wollen.
  • Presse und Sport-Dienste, die etwa aus den Ergebnissen einer regelmäßig stattfindenden Sportart wie z.B. Fußball einen kurzen lesbaren Bericht erstellen wollen.
  • Hersteller von Produkten, die ihre Erzeugnisse online und offline mit passenden Texten beschreiben wollen.
  • Anbieter, die immer wiederkehrende Daten selbst erzeugen (z.B. Protokolle von technischen Geräten oder von Software), die die Ergebnisse bzw. Ausgaben dieser Geräte in Sprache verwandeln müssen, beispielsweise als Managementbericht.
  • Genauso ist es denkbar, das Ergebnis von wiederkehrenden Ereignissen (etwa politische Wahlen) automatisiert mit Text zu versehen. Hier ist zwar der Ausgang nicht vorhersehbar, jedoch ist die Struktur der Daten von Ereignis zu Ereignis immer gleich.

Darüber hinaus sind noch lange nicht alle möglichen Einsatzzwecke der Content-Software abgedeckt. Gerne helfen wir auch Ihnen, aus ihren bestehenden Daten echten und einzigartigen Content zu erstellen.

 

Tipp: Wenn Sie mehr über die Technologie der Automatisierten Erstellung von Texten mit „Automatic Unique Content“ (AUC) erfahren möchten, so nehmen Sie bitte mit Awantego Kontakt auf.

Jede Firma bzw. jeder Redakteur, der über eine Mindestmenge an strukturierten Daten verfügt (in der Regel mehr als 1.000 Datensätze) kann mit diesen Daten und der Interpretation durch die „Auszeichnungssprache“ ATML3 mit einer vergleichsweise geringen Investition, automatisiert und einzigartige Texte (Unique Content) erstellen.

Was kann automatische Text-Erstellung nicht leisten

Wichtig im Zusammenhang mit der automatischen Texterstellung ist es, sich zunächst einmal auch zu vergegenwärtigen, wofür die Technologie nicht eingesetzt werden kann. Für die folgenden Zwecke ist sie eher ungeeignet oder schlicht unangebracht:

  • das Erstellen von Texten ohne eine vorhandene Textstruktur, etwa ein Gedicht oder einen Liebesbrief
  • das Umschreiben von bestehenden Texten ist mit ATML3 nur bedingt bzw. in vielen Fällen nicht möglich

Wo werden automatisierte Text bereits heute verwendet

Fußballberichte:

Automatische Berichte im Fussball

Automatische Berichte im Fussball

Bereits seit mehreren Jahren wird die Technologie der automatischen Texterstellung im Bereich der Sportberichterstattung verwendet. Praktisch alle Fußballberichte die heute jeden Samstag ab 17:31 Uhr – also nur wenige Augenblicke nach den Ergebnissen der ersten Bundesliga – veröffentlicht werden, sind von einer Software erstellt.

Wirtschaftsberichte:

Ebenso wird automatischer Content im Bereich der Wirtschaftsberichte und Veröffentlichungspflichten von großen Konzernen verwendet.

Aktien- und Börsenberichte

Die Werte einzelner Aktien, die Zusammenfassung des Handelstages an der Frankfurter oder New-Yorker Börse werden heute ebenfalls bereits mit Unique Content versehen. Gleiches gilt für die Rohstoffbörsen oder Wechselkurse der wichtigsten Währungen der Welt (Euro, US-Dollar, Yen, Schweizer Franken, etc.)

Onlineshops:

Seit einigen Jahren nutzen große eCommerce-Anbieter wie Amazon oder Zalando bereits die Technologie um automatisch Unique Content zur Erstellung von Produktbeschreibungen.

Voraussetzungen für die Erstellung von Content

Um aus ihren vorhandenen Daten fertige Texte zu erstellen, benötigen Sie ähnlich wie bei einer Back-Rezeptur einige Zutaten. Das sind:

  • eine gleich bleibende Struktur, in der ihre Daten entweder schon vorhanden sind oder später gespeichert sind. Zum Beispiel eine Excel Tabelle oder eine echte Datenbank
  • ein Beispieltext, der später durch eine Anreicherung mit bestehenden Daten sowie mithilfe von sprachlichen Verweisen bzw. Synonymen „de-konstruiert wird
  • eine Idee wo Ihre Texte in Zukunft eingesetzt werden und wie diese Daten verwendet werden sollen

Der Verwendungszweck ist insofern relevant, als dass es in der Regel nicht praktikabel ist 1.000 oder mehr Texte manuell auf elektronischen Plattformen wie Webshops, Ratgeber-Seiten oder Onlineverzeichnissen zu publizieren.

Den automatisch erstellen Unique Content möchten Sie in aller Regel automatisch veröffentlichen lassen. Genau darauf ist die vorgestellte Technologie ausgelegt.

Wie Sie mit Ihren vorhandenen Daten automatisiert Texte erstellen

Im nachfolgenden erläutern wir in kurzen, groben Schritten, wie sie mit den oben genannten Zutaten tatsächlich Unique Content erstellen.

Datenstruktur festlegen

Automatisch Texte erstellen

Automatisch Texte erstellen

Im ersten Schritt werden zunächst einmal die Datenstruktur und die Datenbasis der vorhandenen Inhalte analysiert. Je nachdem ob es sich um Sportdaten, Produktdaten oder andere in Zeilenform vorliegende Inhalte handelt, werden diese zunächst einmal von einem Spezialisten in ihrer eigentlichen Struktur untersucht.

Pro Tabelle bzw. Texttyp sollten die Daten in einer einheitlichen und nahezu uniformen Art und Weise vorliegen.

Beispiel:

Gehen wir im einmal davon aus, dass sie entweder selber im Besitz einer Excel- Tabelle von Produktdaten sind. Dabei ist es unerheblich, ob Sie als Großhändler eine Excel Liste eines Lieferanten umsetzen möchten oder ob es sich bei den enthaltenen Produktdaten um ihr eigenes Produkt handelt.

Die Spalten der Tabelle, in denen etwa der Produktname, die Produktnummer, der Preis oder andere Attribute des Produktes enthalten sind, werden nun so umbenannt, dass danach die Texterstellung möglichst leicht vonstattengehen kann. Dabei ist es wichtig, Datenfelder bzw. Datenspalten von sprachlichen Begriffen zu unterscheiden.

Dies wird unter anderem dadurch erreicht, indem den Überschriften (also Bezeichnungen) der Daten-Spalten eine Vorsilbe (z.B. Data_) vorangestellt wird.

Sofern in der weiteren Texterstellung bestimmte Adjektive oder Attribute mitgegeben werden sollen, so werden dort die Spaltenüberschriften ebenso passend normiert. Bei der nachfolgenden Analyse der Beispieldaten wird außerdem darauf geachtet, dass etwa Beschreibungen und Adjektive entweder einheitlich im Singular oder durchweg als Plural eingetragen sind.

De-Konstruktion des Beispiel-Textes

Wie schon erwähnt, kann selbst die beste Text-Software zum heutigen Zeitpunkt nicht von alleine ohne Kontext vom weißen Blatt her einen fertigen Text erstellen.

Es ist daher in der Regel notwendig, einen vorhandene Beispiel-Text zu „de-konstruieren“. Dazu wird ein für den Einsatzzweck passender Text in seine einzelnen Bestandteile zerlegt.

Im ersten Schritt wird festgelegt, an welchen Stellen die Produktdaten, die Produktattribute und weiteren Eigenschaften in den Text einfließen sollen bzw. können.

Im zweiten Schritt wird nun versucht, über die Variation und Verwendung von Synonymen den Text bei der anschließenden automatischen Erstellung variantenreicher zu gestalten.

Im dritten und letzten Schritt werden logische Abhängigkeiten und sprachlich erfasst. So wird etwa aus dem Handy für 99,- ein „besonders preiswerte Smartphone“. Die dafür notwendigen Abhängigkeiten des einzelnen Textes zur gesamten Menge an Produkt-Daten werden dabei von der Technologie erkannt.

Bei der automatischen Texterstellung ist es zwar möglich auch im Nachhinein unterschiedliche Ansprachen des Lesers zu verwenden. Dennoch empfehlen wir, bei der Erstellung des ersten Textes eine konkrete „Buyer Persona“ zu verwenden und vorab die Frage zu klären ob die Leser mit „Du“ oder „Sie“ angesprochen werden.

Text-Skelett erstellen

Screenshot Webinterface Unique Content Erstelliung

Screenshot Webinterface Unique Content Erstelliung

Unser Beispieltext ist nun soweit in seine Bestandteile zerlegt worden. Es ist klar an welchen Stellen welche Inhalte automatisiert eingefügt und variiert werden. Nun kommt nun die Stunde der Computer Linguisten bzw. der in der ATML3 geschulten Germanisten bzw. Redakteure.

Im ersten Schritt wird zunächst das leere Content-Skelett (ein sog. „Training“) erstellt. Danach werden die Datenfelder in der Beschreibungs-Sprache ATML 3 bekannt gemacht. Anschließend werden die Produkteigenschaften sowie Produkt-Adjektive in der Software verankert. Dabei werden im Wesentlichen die Daten-Spalten bzw. Felder mit den richtigen Plätzen in dem zukünftigen Text verbunden.

Im Anschluss daran entsteht Schritt für Schritt erst ein kurzer Satz, dann ein längerer Abschnitt bis der erste Text vollständig fertig gestellt ist. Grundsätzlich kann das Textskelett je nach gewünschter Länge mehrere Sätze oder Absätze enthalten.

Dabei ist es möglich, das Erscheinen einzelner Sätze an bestimmte Bedingungen zu knüpfen. So kann beispielsweise ein Satz, in dem der Preis des Produktes auftaucht so gestaltet werden, dass ein besonders günstiges oder besonders treueres Produkt als solches von der Software erkannt wird und ein passender und beschreibender (deutscher) Satz verwendet wird.

Hinweis: Grundsätzlich können automatisierte Texte nicht nur in Deutsch oder Englisch sondern aktuell in insgesamt 13 unterschiedlichen Sprachen (darunter auch Chinesisch/Mandarin oder Japanisch) erstellt werden. Bitte beachten Sie dazu auch den Hinweis am Ende des Beitrags (siehe Seite 12).

Wir empfehlen bei der erstmaligen Erstellung eines Textes diesen zunächst in der Ursprungssprache bzw. Muttersprache zu erstellen. In einem zweiten Schritt kann dann aus dem bestehenden Textskelett eine formale Übersetzung erzeugt werden, die dann ebenfalls in Form eines Textskelett des für die jeweilige Sprache variiert wird. Mehr dazu in unserem Artikel Mehrsprachige Produktbeschreibungen: Übersetzen oder neu schreiben?

Content-Prototyp testen

Der erste Content-Prototyp wird erstellt

Der erste Content-Prototyp wird erstellt

Aus der Erfahrung der unterschiedlichen Content Projekte sollten Sie, nach den ersten zwei oder drei sprachlich erstellten Sätzen einen ersten Probelauf mit einigen, wenigen Daten-Sätzen (also Zeilen in Ihrer Datenbank bzw. Excel-Datei) durchführen.

In dieser ersten Phase empfehlen wir noch keine Bedingungen und Verzweigungen bzw. Verknüpfungen mit anderen Datenbanken vorzunehmen. Hier geht es zunächst einmal darum mit relativ wenig Aufwand die Möglichkeit der Texterstellung zu erkennen und anschließend sicher zu sein, dass in der nachfolgenden Arbeit auch die grundsätzliche Richtung in der Texterstellung stimmt.

Dazu gehört neben der Tonalität selbstverständlich auch, dass der Text grammatikalisch richtig ist.

Daneben wird bei Online-Projekten in der Regel auch gemeinsam mit Spezialisten für Suchmaschinenoptimierung (SEO) geprüft, ob der erzeugte Content das Potential hat, die betroffenen Texte im Ranking weiter zu verbessern.

Text erweitern

Sofern unser Textskelett den ersten Test bestanden hat, werden nun der Text-Umfang und auch der Inhalt erweitert. Dabei ist es zunächst einmal unerheblich ob aus möglichst wenigen Daten möglichst viel Text erstellt werden soll oder ob eine gewisse Mindestanzahl an Zeichen oder eine vordefinierte Wortlänge erreicht werden muss.

Ebenso beginnt man in dieser Phase in der Regel damit definierte Bedingungen in den Text einzufügen. Dazu gehört beispielsweise das Herausstellen von Extremen (günstigstes Produkt; größtes Handy) oder das Variieren von Texten in Abhängigkeit der Produktqualität.

Last but not least können in diesem fortgeschrittenen Stadium selbstverständlich weitere Datenquellen in die Texte eingebunden werden. Denkbar sind beispielsweise hier geographische Daten (Orte, Städte oder Länder), die mit bestehenden Adressen kombiniert werden.

Content erneut testen

In einem letzten Schritt wird nun das bis hierhin erstellte Textskelett mit einer Auswahl von Datensätzen getestet. Dabei ist es wichtig, dass sowohl normale Dateninhalte als auch Datenzeilen mit statistisch extremen Werten genutzt werden. Mit diesem Schritt wollen wir testen, ob der gewünschte Text mit all seinen Bedingungen und möglichen Variationen auch tatsächlich sprachlich einwandfrei erstellt wird.

Dieser Vorgang ähnelt ein bisschen dem, wie in der Softwareindustrie Qualitätssicherung betrieben wird.

Selbstverständlich wird auch hier nochmal ein explizites Augenmerk auf richtige Konjugation und Flexionen von Begriffen (https://de.wikipedia.org/wiki/Flexion) gelegt und jeder einzelne fertige Text von einem Redakteur durchgelesen.

Etwaige und notwendige Korrekturen werden nun noch am Textskelett durchgeführt. Danach können aus den Daten und dem fertig gestellten Textskelett automatisch viele Texte hoch-automatisiert erstellt werden.

Produktives und automatisiertes Erstellen des Contents

Unique Content automatisch erstellen

Unique Content automatisch erstellen

Sobald die erste Version unseres getesteten Content-Skeletts fertig gestellt ist, können nun so viele Texte automatisiert erstellt werden, wie Daten-Zeilen vorhanden sind.

Sobald die Textqualität eine für den Auftraggeber ausreichende Güte erreicht hat, wird in aller Regel bei wiederkehrenden Textaufgaben nun die Frage nach der halbautomatischen oder gar voll-automatischen Verarbeitung der Textergebnisse zum Thema.

Beispiel: Mehrere 1.000 Artikel Texte für ähnliche Produktkategorien pro Monat sollen in einem E-Commerce Shop veröffentlicht werden. Während man diese Aufgabe im ersten Durchlauf vielleicht noch halb automatisch durchführen möchte, wird ab der zweiten oder dritten Wiederholung hier ein vollautomatischer Mechanismus Sinn machen. Dieser Automatismus holt zunächst die 1.000 erzeugten Beschreibungstexte von der Content Plattform ab und publiziert den Content anschließend möglichst automatisch auf der Ziel-Webseite ein.

Durch die Nutzung von bestehenden technischen Schnittstellen der Content-Plattform (mit Hilfe einer API, engl.: Application Programming Interface) sowie anderer automatisierter Prozesse können praktisch alle Systeme, die über das Internet miteinander verbunden sind automatisiert Content abrufen.

Weitere Einsatzfälle

Die weiteren möglichen Einsatzzwecke der automatischen Content Erstellung liegen in vielen denkbaren Bereichen:

  • Produktkataloge:
    Überall dort, wo bisher vernünftige textliche Beschreibungen etwa für große Produktkataloge nicht wirtschaftlich leistbar war, kann die automatische Texterstellung dazu beitragen, diese unveröffentlichten Daten in die online Welt oder in einen Printkatalog zu überführen.
  • Suchmaschinenoptimierung:
    Im Bereich der Suchmaschinen-Optimierung (SEO) eignen sich die Texte dazu, bestehende Produktbeschreibungen und Einträge so zu erweitern, dass der Betreiber der entsprechenden Plattform einen spürbaren Vorteil bei der Positionierung in Google oder Bing erzielt. Dies ist vor allem daher interessant, da es sich dabei um eine sog. White-Hat Methode handelt (also aus Sicht von Suchmaschinenbetreiber Google erlaubt ist), da sie ausschließlich auf Onpage-Veränderungen basiert.
  • Ungenutzte Datenquellen/Informationsdatenbanken:
    Daten, die bisher überhaupt nicht für die Verwendung in online oder offline Medien vorgesehen waren. Etwa Wetterdaten oder andere statistische Erhebungen.
  • Jahresberichte/Reportings/Berichtswesen:
    Mithilfe der automatisierten Erstellung von Unique Content ist es möglich individuell Berichte von Daten zu erzeugen, die bis dato nicht wirklich gerne oder angenehm zu lesen waren. Denken Sie nur an die Jahresberichte oder monatlichen Auswertungen von Steuerberatern oder Wirtschaftsprüfern.

Vielsprachige Anwendungsmöglichkeiten

Mit ATML 3 können Sie Unique Content in 13 verschiedenen Sprachen erzeugen. Unter anderem in:

Deutsch Niederländisch
Englisch Schwedisch
Französisch Norwegisch
Spanisch Polnisch
Italienisch Japanisch
Portugiesisch (Br.) Chinesisch
Dänisch … weitere in Planung

 

Kontakt

Wenn Sie mehr über die Technologie der Automatisierten Erstellung von Unique Content (AUC) erfahren möchten, so nehmen Sie bitte mit uns Kontakt auf.

Wie beraten Sie gerne ausführlich wie auch Sie von der automatisierten Erstellung von Inhalten ( Online- und Offline) profitieren können.

Sie erreichen die Web-Redaktion für Unique Content unter +49-(0)711-4889050.