Job Finder — Automated Vacancy Scraper
Vollautomatisches Python-Tool, das täglich Stellen von 6 Quellen scrapet, sie nach 6 Komponenten bewertet und Top-20 in Google Sheets exportiert — gestartet um 09:00 via GitHub Actions.
Manuelles Job-Hunting ist Chaos: täglich 5–6 verschiedene Plattformen, Hunderte irrelevante Stellen, manuelles Filtern nach Stack, Typ, Level. Dieses Tool automatisiert den gesamten Prozess und liefert einmal täglich die besten Treffer mit Bewertungen direkt in eine Google Tabelle.
Highlights
- Sammelt Stellen von 6 Quellen (RemoteOK, WeWorkRemotely, HackerNews, Adzuna, StepStone, XING) parallel im async-Modus; Stack-Extraktion aus Freitext mit FlashText (200+ Terme, O(n)).
- 6-Komponenten-Scoring pro Stelle: Stack-Match, TF-IDF-Profil-Ähnlichkeit, Remote-Typ, Stoppwörter, Vertragstyp, Entry-Threshold — SHA256-Deduplizierung mit Run-to-Run-State-Tracking.
- Exportiert Top-20 täglich in Google Sheets mit Farbkodierung und Score-Aufschlüsselung; automatischer Start um 09:00 Uhr via GitHub Actions CI.
- 130 Tests, >80% Coverage; Python 3.11+, async/await, Pydantic v2, httpx, feedparser, BeautifulSoup4, scikit-learn (TF-IDF), gspread.
Impact
- ↑6 job sources scraped in parallel async mode daily
- ↑130 tests, >80% coverage on scoring and aggregation pipeline
- ↑Top-20 delivered to Google Sheets with color-coded scores
- ↑Zero manual filtering — full pipeline from source to export