Wie bekommen wir die Daten?

Unser Ziel ist es, mit künstlicher Intelligenz die Beratung im Reisebüro anzureichern – mit besseren Informationen, fundierter Beratung und Kontaktaufnahme mit den Leistungsträgern.

Gerade der Tourismus in Europa wird damit gestärkt, Touristen können dadurch intensiver reisen und mehr Guthaben und Zeit für ihren Urlaub investieren.

Techgiganten haben Daten

Facebook, Google und andere Unternehmer horten ihre Schätze. Das obwohl, die Benutzer ihre Daten einbringen. Die meisten Techunternehmer offerieren kostenlos ihre Plattform und beabsichtigen damit, davon durch Geschäfte zu profitieren. Es ist unwahrscheinlich, dass dieses Wissen von Nutzerdaten verstaatlicht wird, hingegen sehr wahrscheinlich, dass Geschäftsmodelle scheitern, die auf kostenlose Nutzung der Daten dieser Techunternehmen beruhen. Firmen werden also beispielsweise wahrscheinlich auch zukünftig für individuelle Werbung via Nutzerdaten zahlen müssen.

Es bleibt also nur die Möglichkeit, auf allgemein zugängliche Daten zugreifen zu können. Gehört Google Maps dazu? Google hat hierzu ein Lizenzmodell.

Die bei Bookings eingetragenen Hotels sind interessant, doch oft fehlen wesentliche Informationen, wie z.B. Ansprechpartner.

Die meisten Webseiten von Hotels oder Sehenswürdigkeiten lassen sogenannte Crawler zu. Da könnten wir uns theoretisch ein System überlegen und das Internet durchscrollen. Für einen Test könnten Programme von IBM, Microsoft oder Google genutzt werden, um genügend Rechnerkapazität zu haben.

Beim Webcrawler wird das Internet durchsucht, es werden Daten entnommen und diese werden aufbereitet und könnten via einer Datenbank ausgelesen werden.

KI Projekt Webcrawler realisieren?

Im Buch “Natürlich alles künstlich” von Philip Häusser wird ausführlich beschrieben, wie die KI funktioniert. Dennoch, es hat mich überfordert, und ich suche gerne den Kontakt mit dem Autor, wenn ich mal in München bin, z.B. auf der Messe F.re.e.

Künstliche Intelligenz braucht maschinelles Lernen, aufbauend auf neuronalem Netz „Deep Learning“ zur Entwicklung. Modelle erklären die Welt, und wir sollten wissen, was wir eigentlich möchten. Um ein Modell zu trainieren braucht es Daten. Die haben vor allem Techkonzerne, im Internet sollte genügend auf Webseiten vorhanden sein.

Ein Modell zu beschreiben, stellt sich für mich als immense Herausforderung dar. Ich schaue mal bei der ETH vorbei. Um die Daten zu „crawlen“ wird es wahrscheinlich Rechnerkapazitäten brauchen, von den grossen Techfirmen gibt es zwar Unterstützung für Startups. Wie die Realisierung des Projekts, das ist offen. 

„Natürlich alles künstlich“ von Philip Häusser
erschienen im Drömer Verlag, ISBN 978-3-426-27851-2

Sofern das Modell funktioniert, können Investitionen mitsamt seinen Investoren durchaus auch von staatlicher Seite angegangen werden.

Einbau als Praxisarbeit

Aktuell arbeitet für uns eine Praktikantin. Sie soll ein Praxisprojekt abwickeln. Das Projekt skizzieren wir wie folgt:

  • Der Crawler sucht nach Hotels auf der ganzen Welt und nutzt die jeweilige Landessprache.
  • Wir suchen uns einige Begriffe, wie Name, Adresse, Kontaktdaten, Informationen zum Ort, auch Bilder.
  • Alle Daten zum jeweiligen Urlaub werden gesammelt und in einer Datenbank aufbereitet.
  • Diese Datenbank steht allen Interessierten zur Verfügung.
  • In die entsprechenden Webseiten zu Ländern werden die Hoteldaten in Citadela-Verzeichnisse eingelesen.
  • Zu vielen Ländern haben wir Webseiten erstellt, die gefüllt werden könnten reisen.international/laender

Pflichtenheft

Wir suchen weiterhin für diese Idee Partner. Auf der ITB Berlin sind Gespräche geplant. Schon heute ist vorhersehbar, dass die Praxisarbeit sich in der Praxis erst noch bewähren muss.

  1. Dokumentation über das Projekt nach der IPERKA-Methode erstellen
  2. Ein Arbeitsjournal schreiben, in dem der Fortschritt und die Probleme, für jeden Tag dokumentiert wird.
  3. Das Projekt ist ein Web Scraper. Es soll mit Hilfe von Beautifulsoup in Python entwickelt werden.
  4. Der Web Crawler sollte eine benutzerfreundliche, sauber aussehende UI haben.
  5. Der Web Scraper wird sich hauptsächlich darauf konzentrieren, Übernachtungsangebote (Hotels, Hostels, Motels, Bed&Breakfasts, usw.) zu finden.
  6. Neben der Möglichkeit, nach einem bestimmten Thema zu suchen, soll es auch die Möglichkeit geben, die Ergebnisse zu filtern (z.B. bestimmte Länder)
  7. Der Web Scraper soll in 4 Sprachen verfügbar sein: Deutsch, Französisch und Englisch, aber auch lokale Sprachen mithilfe vom Google Translator einbinden
  8. Der Web Scraper generiert aus seinen Ergebnissen eine Datenbank (und möglicherweise stellt sie im CSV-Format zum Download bereit.)
  9. Der Web Scraper muss in WordPress integrierbar sein. Dies kann durch das Schreiben eines Plugins in PHP für WordPress geschehen, das den Python-Code aufruft.
  10. Es soll eine Anleitung zur manuellen Installation in WordPress und Nutzung des Web Scrapers erstellt werden, insbesondere für Citadela, wo wir eine Lifetime Lizenz haben und bereits Erfahrungen haben.

Die Praxisarbeit wurde fertiggestellt, die Ziele nicht erreicht. Hier die ausführliche Dokumentation sowie den Code.

Es gibt auch ein Handbuch, welches nicht mehr aktuell ist.

Zum Thema Web Scraper hat die Praktikantin eine gute Präsentation gehalten

Gerne freuen wir uns auf Ihre Anregungen und Ideen. Wir möchten die Idee gerne weiter verfolgen.

Dafür eine Ausschreibung bei Upwork.

  • Das Projekt ist gescheitert. WordPress und Python scheinen gemeinsam nicht zu funktionieren. Wahrscheinlich muss das Projekt von Grund auf neu gedacht werden.
  • Bei der Dokumentation ist auf den letzten Seiten der Workaround mit Octoparse beschrieben. Wir hatten schlussendlich den Scraper auf die Google Suche orientiert, der Scraper wurde immer wieder blockiert. Booking hat funktioniert, doch sind wir an vollständigen Kontaktdaten interessiert. Bei Google hatten wir auf dem Bild URL und Telefonnummer, diese jedoch nicht ausgelesen
  • Octoparse ist eine Cloud-basierte Lösung. Mit Octoparse können Webseiten extrahiert werden. Die Funktion von Octoparse ist in der Dokumentation beschrieben. Irgendwie sollten wir das nutzen können.
  • Das Ziel ist nach wie vor, unsere Reisewebseiten mit Übernachtungsmöglichkeiten zu füllen und auch ein Plugin der WordPress Community zur Verfügung zu stellen. Die Daten sollten eine direkte Anfrage ermöglichen
  • Bei der Ausschreibung auf Upwork wurde auf unzulängliche Serverkapazitäten hingewiesen. Es muss also mit Kosten gerechnet werden. 
  • Anbieter wollen das Scraping als Service anbieten, statt ein Plugin für WordPress zu entwickeln. 

Die Ausschreibung bei Upwork hat gezeigt, dass einige Freelancer in der Lage sind, die Daten von Google Maps abzugreifen. Wir werden das weiter verfolgen. Das Ziel bleibt ein WordPress Plugin.

Aufgrund der Weiterentwicklung der KI wird die Lösung nicht mehr weiterverfolgt. Heute findet die KI effektiver Daten, als mit Web Scraping.

Reiseangebote erstellen in wenigen Sekunden

Von Schmetterling habe ich erfahren, dass ihr Midoffice mit Paxlounge verbunden. Das soll ein System, welches mit künstlicher Intelligenz Reiseangebote ausarbeitet. Hakan Duganci meint, die Reisebüros sparen viel Zeit.

Ein zusätzliches Serviceentgelt kann verrechnet werden. Das Unternehmen präsentiert sich wie folgt auf seiner Internetseite:

Seit 2009 steht paxconnect als Standard-Software für erfolgreiche Reisebüros. Mit unserem Live-Beratungs-System haben wir die Touristik in Deutschland auf den Kopf gestellt. 5.000 Reisebüros und Onlineportale nutzen intensiv unsere Lösung.

Die „paxlounge“ steht für die Leidenschaft eines Produkts, das jeden Tag neue Kunden gewinnt und durch ständige Innovationen neue Mehrwerte und hohe Zufriedenheit schafft.

An unserem Firmensitz, an der Stelle des Praetorium, dem Amtssitz der römischen Statthalter in Köln, entfaltet sich seit November 2018 unser 14-köpfiges operatives Team.

Hier geht’s zur Webseite von Paxlounge

Sehr viele Reisebüros arbeiten bereits mit dem System. Es ist ein beliebtes Beratungstool. Rein theoretisch könnte ich 30 Tage Paxlounge testen. Dabei kann ich die Frage klären, wie die Provisionsregelung aussieht und aus welchen Quellen die Reisen zusammen gestellt werden.

Mittlerweile kommen treten immer mehr Anbieter in den Markt ein. Die Ergebnisse werden immer besser, doch wie sieht es aus mit der Informationsflut. Ertrinken wir darin womöglich? Vor Jahren habe ich mit dem Reisecoaching begonnen. Diesen menschlichen Ansatz gebe ich die bessere Zukunftsperspektive.

Wir beobachten den Markt und suchen gerne den Kontakt mit den Reisenden.

Künstliche Intelligenz als Suchmaschine?

Bei OpenAI werden alle Befehle als Prompts eingegeben. Das ist als ob sich Nutzer durch eine Suchmaschine quälen. Sie suchen wiederholt nach Informationen, Ergebnisse und die Auswertungen werden daraufhin angezeigt. Doch was sie wirklich benötigen, müssen sie selber ins Auge fassen und zusammenstellen.

Ein Beispiel; ein Kunde möchte zum Trompetenfestival nach Guca, dort in einem typischen Hotel übernachten, gutes Essen genießen, Karten für das Festival kaufen, Ausflüge unternehmen etc..

Heutzutage kommt er nicht umhin, sich alles mühevoll allein zusammenzusuchen, falls kein fertiges Reiseprogramm besteht, das sämtliche Dienstleistungen einschließt. „Zusammenstellen oder jemanden beauftragen“ ist Voraussetzung. Eine KI-Lösung könnte da allerdings weiterhelfen.

KI-Lösungen können allerdings weiterhelfen!

Ein Reisebüro vermag es, jedes einleitende Reisekonzept zu optimieren und weitere wertvolle Tipps zu geben. Mittlerweile ist KI teils mehr, teils weniger weit.
Ich lade Sie aber entschieden dazu ein, auch über meine Versuche zu lesen.

Ein Prompt würde wie folgt aussehen; von Vorteil auf Englisch, hierbei hilft der Google Translator:

How to travel to trumpet festival in Guca, when will it happen, 3 nights in a typical hotel there, tickets for festival, recommendations for restaurants, excursion and tourguides

Demnächst intendiere ich, zu dem Zweck als eine spezifische Lösung im Tourismus gezielt AI zu realisieren. Reisebüros sollten dazu eingebunden werden, beispielsweise die endgültige Organisation hierfür übernehmen. Leistungsanbieter rechnen in der Regel Provisionen für Reisebüros mit ein. Microsoft kaufte sich bei OpenAI ein und bietet mittels Suchmaschine Bing eine AI-Unterstützung an. Das folgende Video beschreibt seine Idee.

Die AI-Unterstützung im Video ist eine Empfehlung zu individuellen Zwecken und mit Informationen aus dem Web gefüttert, welche Akteure der Tourismusbranche ausarbeiten könnten. Allerdings funktionierte meine AI-Idee „mit Guca“ nicht. Letzthin änderte sich das aber, beispielsweise im Mai 2023. Mit ChatGPT lassen sich rasch Reiseprogramme entwickeln. Die Kundschaft bekommt dadurch eine Vorstellung, was sie auf ihren Reisen erwartet. Auf dem folgenden PDF „Trompetenfestival Guca“ sind die Hotels noch ausgespart. Es ist jedoch nur eine Frage der Zeit, bis sich alles automatisiert.

Schreibe ich nur noch im Internet, und wo bleibt die Kreativität?

November 2023; wir tauschten am Tourismustag in Niedersachsen unsere Anschauungen zur künstlichen Intelligenz aus. ChatGPT wird empfohlen, kostet allerdings USD 20 monatlich, aber bietet viele Möglichkeiten. 

Wir schauten uns ChatGPT an, via Version GPT3.5 enttäuschend. Bing hingegen erstellt viele Informationen, lange Texte und zeigt sogar die Links an. Bard wiederum erstellt fehlerhaft, arbeitet jedoch sehr strukturiert. 

Unser Prompt 

Beispiel Reiseprogramm: Teereise nach Ostfriesland, Anreise mit Deutschlandticket, Tipps für Ausflüge, Restaurants und Hotels, Orte: Leer, Emden, Aurich, Norden.

Wobei ebenso Prompt fehlerhaft ist: Die entsprechend bestimmende Rolle (Reiseprogramm/Teereise/Ostfriesland) sowie ein Beispiel (konkret geschilderter Ausflug) fehlten im Ergebnis.

Wie sehen wir die Zukunft? 

Mit zunehmender Geschwindigkeit entwickeln sich die KI-Programme. Jedoch erfordert es die Erkennung von Fehlern und zusätzlich, wie realistisch die Durchführungen ihrer Niederschriften sind, wie beispielsweise die Reiseverwirklichung unserer erwähnten Teereise.

Die Ergebnisse sind zwar wesentlich besser als früher. Doch bräuchte es noch jemanden, mit dem sich die Menschen austauschen können, am besten jemanden mit reichlich Erfahrungen über Reiseziele. Insofern dürften sich solche Austausche durch zusätzliche Erfahrungen von Kunden optimieren. Wir sollten uns generell mehr austauschen.

Es besteht ein Risiko, dass wir, kaum neu im Prompt angelangt, noch suchen und drinnen hängenbleibend auch gleich von dessen Werbung manipuliert werden. Egal welche Anbieter Prompts offerieren, am Ende machen Prompts ein Geschäftsmodell aus. Zahlreiche Unternehmen integrieren Prompt, um branchenorientierte Lösungen zu verkaufen.

Das klar strukturierte Google Bard schien eine Lösungen zu sein. Es kannte sich am besten im Internet aus, machte noch viele Fehler. Google Bard wurde optimiert und gehört nun der Vergangenheit an; es ist das heutige Google Gemini.

Hier ein Video zum ehemaligen Google Bard;

Die Ergebnisse von Google Gemini sind faszinierend, ausführlich, anregend und nahezu fehlerfrei. Die Systeme werden immer besser, dem Menschen sind sie bereits überlegen.

Was ergibt für Unternehmer noch Sinn?

Was ergibt für uns Unternehmer, die wir im Internet unterwegs sind, überhaupt noch Sinn? Fleißig Webseiten gestalten? Wir, beziehungsweise mein Unternehmen und all jene, die KI nutzen, dürfen noch unsere Ideen dazu liefern. Jetzt heißt es, erst recht viel mehr zu kommunizieren und gemeinsam an der Entwicklung der KI mitzuwirken. KI ist Fluch und zugleich Segen. In Zukunft gewinnen wir wahrscheinlich, indem wir vor allem unsere persönlichen Eindrücke einbringen, die wir beschreiben, und hoffen, dass unsere Webseiten gelesen werden.