Einführung #
Dieses Python-Skript bietet verschiedene Funktionen zur Datenverarbeitung von Excel-Dateien. Es ermöglicht Datenkorrekturen, Migrationen, Ergänzungen und die Bereinigung von HTML-Texten in Excel-Zellen. Die grafische Benutzeroberfläche (GUI) wurde mit der tkinter
-Bibliothek erstellt. Benutzer können über eine Auswahl an Buttons verschiedene Funktionen aktivieren.
Voraussetzungen #
Das Skript verwendet Python-Bibliotheken wie openpyxl
(für die Arbeit mit Excel-Dateien) und tkinter
(für die GUI). Eine virtuelle Umgebung (venv_2024_v2
) liegt im gleichen Ordner wie das Skript. Sie muss aktiviert werden, bevor das Skript ausgeführt werden kann.
Anforderungen: #
- Python 3.x
- Bibliotheken:
openpyxl
,tkinter
- Betriebssysteme: Mac oder Windows
Installation der Abhängigkeiten #
Stellen Sie sicher, dass sich die virtuelle Umgebung venv_2024_v2
im gleichen Ordner wie das Skript befindet. Installieren Sie die erforderlichen Bibliotheken, falls noch nicht geschehen, indem Sie die virtuelle Umgebung aktivieren und dann die Abhängigkeiten installieren.
Aktivierung der virtuellen Umgebung: #
Windows:
venv_2024_v2\Scripts\activate
Mac/Linux:
source venv_2024_v2/bin/activate
Installieren Sie dann die Abhängigkeiten:
pip install openpyxl tkinter
Ausführen des Skripts #
Nach Aktivierung der virtuellen Umgebung können Sie das Skript ausführen:
python skriptname.py
Funktionen des Skripts #
1. datei_auswaehlen()
#
Diese Funktion öffnet einen Dateiauswahl-Dialog, um eine Excel-Datei auszuwählen. Sie wird in den verschiedenen Funktionen zur Auswahl der Quelldatei genutzt.
Anwendung:
Wird durch Buttons zur Dateiauswahl in der GUI aufgerufen.
2. parse_bereiche()
#
Diese Funktion nimmt einen String (z. B. „1;3;5-7“) und wandelt ihn in eine Liste von Zeilen-Nummern um.
Beispiel:
Eingabe: „1;3;5-7“
Ausgabe: [1, 3, 5, 6, 7]
3. spalten_zu_indices()
#
Wandelt einen String mit Spaltenangaben (z. B. „A;B;D“) in eine Liste von Spaltenindizes um.
Beispiel:
Eingabe: „A;B;D“
Ausgabe: [1, 2, 4]
4. starte_datenmigration()
#
Diese Funktion übernimmt Daten aus einer ausgewählten Quelldatei und kopiert nur bestimmte Spalten und Zeilen in eine neue Excel-Datei. Dabei können Benutzer spezifische Zeilen und Spalten angeben.
Anwendung:
- Auswahl einer Quelldatei
- Eingabe der zu migrierenden Spalten und Zeilen
- Erstellung einer neuen Excel-Datei mit den kopierten Daten
5. bereinige_und_konvertiere_wert()
#
Diese Funktion bereinigt Text von unerwünschten Zeichen (z. B. „€“) und wandelt ihn, wenn möglich, in einen numerischen Wert um.
Beispiel:
Eingabe: „1.234,56€“
Ausgabe: 1234.56
6. convert_to_string()
#
Wandelt numerische Werte in String-Darstellung um, falls nötig.
7. korrigiere_daten()
#
Vergleicht Daten aus einer Basisdatei und einer Kontrolldatei und korrigiert Werte in der Basisdatei basierend auf den Werten in der Kontrolldatei.
Anwendung:
- Auswahl von Basis- und Kontrolldatei
- Angabe der Spalten, die verglichen und korrigiert werden sollen
- Ergebnis wird in einer neuen Excel-Datei gespeichert
8. ergaenze_daten()
#
Diese Funktion ergänzt fehlende Datensätze aus einer Kontrolldatei in eine Basisdatei. Dabei wird nach einer eindeutigen Kennung (z. B. ID-Nummer) gesucht, um fehlende Informationen zu ergänzen.
Anwendung:
- Auswahl von Basis- und Kontrolldatei
- Angabe der Spalten, die verglichen und ergänzt werden sollen
9. bereinige_html_text()
#
Entfernt HTML-Tags aus Text.
Beispiel:
Eingabe: „
Beispieltext“
Ausgabe: „Beispieltext“
10. bereinige_html_in_spalten()
#
Bereinigt HTML-Tags aus den angegebenen Spalten in einer Excel-Datei und speichert das Ergebnis in einer neuen Datei.
Anwendung:
- Auswahl einer Excel-Datei
- Angabe der Spalten, die bereinigt werden sollen
Benutzeroberfläche (GUI) #
Die GUI ermöglicht eine einfache Bedienung des Skripts durch Buttons, die den Benutzer durch die verschiedenen Schritte führen. Die Funktionen werden durch einfache Buttons gestartet:
- Datenkorrektur: Korrigiert Daten in der Basisdatei mithilfe einer Kontrolldatei.
- Datenmigration: Migriert ausgewählte Daten von einer Quelldatei in eine neue Datei.
- Datenergänzung: Ergänzt fehlende Daten aus einer Kontrolldatei in eine Basisdatei.
- HTML-Bereinigung: Entfernt HTML-Tags aus ausgewählten Spalten in einer Excel-Datei.
Starten des Skripts auf Mac und Windows #
Windows: #
- Öffnen Sie die Kommandozeile (cmd) oder PowerShell.
- Navigieren Sie zum Verzeichnis, das das Skript enthält.
- Aktivieren Sie die virtuelle Umgebung:
bash venv_2024_v2\Scripts\activate
- Starten Sie das Skript:
bash python skriptname.py
Mac: #
- Öffnen Sie das Terminal.
- Navigieren Sie zum Verzeichnis, das das Skript enthält.
- Aktivieren Sie die virtuelle Umgebung:
bash source venv_2024_v2/bin/activate
- Starten Sie das Skript:
bash python skriptname.py
Fazit #
Dieses Python-Skript bietet eine flexible und leistungsstarke Lösung für die Verwaltung und Verarbeitung von Excel-Daten. Die grafische Benutzeroberfläche vereinfacht die Bedienung und ermöglicht auch weniger technisch versierten Benutzern, Aufgaben wie Datenmigration, -korrektur und -bereinigung durchzuführen.