# Haecksen Filme & Serien Wiki Tabellen Skript

Disclaimer: Die Skripte sind alle sehr quick & dirty entstanden und sind nur sehr minimalistisch und rudimentär.


## Voraussetzungen

- python 3.8
- sqlite3
- Linux


## Challenge

- für eine beliebige Liste Filme / Serien einen akzeptablen Output für Copy & Paste ins Wiki bekommen
- die Tabelleneinträge automatisiert mit Eckdaten anreichern, hauptsächlich:
  * robusten Link zur IMDb
  * Jahr der Veröffentlichung


## Lösung

- lokale Datenbank anlegen (1_create_db.py - hier der Einfachheit halber eine sqlite)
- IMDb Datenbank mit Basisdaten ist frei zugänglich (siehe Lizenzierung weiter unten)
  * Daten runterladen: https://datasets.imdbws.com/
  * in Datenbank laden zum automatisierten Abgleich mit individuellem Input (2_import_imdb.py)
- individuellen Input mit diesen Daten abgleichen
- Output daraus generieren

Dieses Päckchen hier wurde zunächst gebaut um eine Liste von Filmen & Serien abzugleichen. Für einen längerfristigen Einsatz wäre es natürlich viel cooler ein weiteres Tool zu haben, mit dem auch komfortabel einzelne Datensätze generiert werden können. Deswegen mache ich jetzt hier mal einen Cut und behandele das separat mit Platzhaltern für den Einzel-Datensatz-Fall.


### viele Datensätze

- individuellen Input ebenfalls in diese Datenbank importieren (import_movies.py)
  * Voraussetzung: Format wie in Beispieldatei movies.txt
- Input mit IMDb Daten abgleichen:
  * per SQL werden die Matches ermittelt
  * Ausgabe der Matches als copy & paste freundliche Variante in Datei (Format: wie Input-Datei)
- User_in wählt manuell die passenden Matches aus:
  * andere Zeilen werden aus der Datei gelöscht
- Re-Import der Treffer-Liste (import_movies.py)
  * für die Liste wird zusätzlich ein Output mit wiki_template.txt generiert


### einzelne Filme / Serien

- optional: individuellen Input ebenfalls in diese Datenbank importieren (<TODO>.py)
  * Voraussetzung: Input via Kommandozeile oder kleinem UI Tool
- Input mit IMDb Daten abgleichen:
  * per SQL werden die Matches ermittelt
  * Ausgabe der Matches zur Auswahl
  * Auswahl- / Bestätigungsdialog
  * gewähltes Match wird in Datenbank gespeichert
  * für gewählte Matches wird Output mit wiki_template.txt generiert


## Lizenzierung IMDb Daten

Die Daten sind prinzipiell frei zugänglich. Hier gibt es die Daten als TSV zum Download: https://datasets.imdbws.com/

Die TSV Dateien sind knapp 1GB groß und werden seitens imdb.com regelmäßig aktualisiert.

Die Daten können für persönliche, private, nicht-kommerzielle Zwecke frei verwendet werden.

Je nachdem wie viel der Daten im Gesamtverhältnis tatsächlich im Wortlaut verwendet werden, muss u.U. ein Copyright-Hinweis angebracht werden. Hier der Hinweis, der laut imdb.com angebracht werden soll, wenn offensichtlich der Großteil der Daten aus der IMDb stammt:
Information courtesy of IMDb (https://www.imdb.com). Used with permission.
