Noxtua Legal Tech

data-engineer-legal-ai bei Noxtua

📍 Berlin, Vollzeit (100% Remote möglich) 🏠 100% Remote Arbeit möglich für Bewerber mit EU-Aufenthaltserlaubnis in Österreich, Kroatien, Deutschland, Polen oder Slowakei 💼 Vollzeit 📋 Unbefristet

Noxtua sucht einen erfahrenen Data Engineer für sein Legal AI Tech Start-Up. Die Position bietet 100% Remote-Arbeit und beinhaltet die Entwicklung von ETL-Pipelines für juristische Daten, Vector Databases und die Integration von Generative AI Techniken im Rechtsbereich.

Gefordert
PythonETL PipelinesXML DatenverarbeitungVector DatabasesRAG SystemsDatenmodellierungAPI Integration
Wünschenswert
Graph DatabasesNLP & Generative AIKubernetesRechtliche Kenntnisse

Was erwartet dich in dieser Rolle?

Als Data Engineer bei Noxtua bist du zentral für die Entwicklung und Optimierung der Dateninfrastruktur im Bereich Legal AI verantwortlich. Du arbeitest an der Schnittstelle zwischen Data Engineering, KI-Entwicklung und juristischen Fachanwendungen.

  • ETL-Pipeline Entwicklung — Design und Implementierung von End-to-End ETL Pipelines für juristische Daten aus verschiedenen Rechtsgebieten
  • XML Datenverarbeitung — Parsing, Validierung und Normalisierung komplexer XML-Strukturen aus offiziellen Rechtsdatenquellen
  • Vector Database Management — Aufbau und Optimierung von Vektorsuch-Infrastrukturen für effiziente Abfragen

Du wirst eng mit Produktteams, KI-Forschern und juristischen Experten zusammenarbeiten, um hochwertige Datenlösungen zu entwickeln, die den Wert komplexer mehrsprachiger juristischer Inhalte nutzbar machen.

Welche Aufgaben erwarten dich?

In dieser Position gestaltest du die gesamte Datenverarbeitungskette von der Datenerfassung bis zur Bereitstellung für KI-Agenten mit.

  • End-to-End ETL Pipelines — Ingestion, Validierung, Cleaning, Transformation, Chunking und Embedding in Vektordatenbanken für juristische Daten
  • Datenmodelle Entwicklung — Entwicklung und Wartung skalierbarer Datenmodelle und Speicher-Schemata für kontinuierlich aktualisierte Datensätze
  • Metadata Enrichment — Implementierung von Strategien zur Maximierung der Auffindbarkeit und Relevanz juristischer Informationen in Vektordatenbanken
  • Generative AI Integration — Erkundung und Integration von Generative AI Techniken für strukturierte Feld-Erstellung, Metadata-Generierung und Dokumentennormalisierung
  • Performance Benchmarking — Durchführung von Datenbank-Performance-Benchmarks zur Sicherstellung effizienter Abfragen und Skalierbarkeit

Du koordinierst auch die Datenübergabe und Integration von internen und externen Datenanbietern, einschließlich offizieller Quellen, APIs und Web Scraping Pipelines.

Was solltest du mitbringen?

Die Position richtet sich an erfahrene Data Engineers mit Fokus auf KI-Entwicklung und Datenverarbeitung.

  • Python Expertise — Starke Programmierkenntnisse in Python und Erfahrung mit KI-Pipelines
  • Data Engineering Erfahrung — Nachweisbare Projekte in KI-Entwicklung oder Data Engineering mit erfolgreicher Implementierung
  • RAG Systems — Erfahrung im Aufbau von KI-spezifischen RAG-Pipelines (Retrieval Augmented Generation)
  • Datenverarbeitung — Expertise in Datenverarbeitung, Filterung und Augmentation
  • Vector Databases — Erfahrung mit Vektordatenbanken, Data Embedding, Benchmarking und Management
  • Englischkenntnisse — Sprachniveau C2 in Englisch für internationale Zusammenarbeit

Erfahrung mit Graph Databases, NLP, Generative AI und Kubernetes ist von Vorteil, ebenso wie rechtliche Hintergrundkenntnisse.

Was bietet dir das Unternehmen?

Noxtua bietet eine attraktive Benefits-Paket für Mitarbeiter im Homeoffice.

  • Flexible Arbeitszeiten — Gestaltung deiner Arbeitszeiten nach eigenen Bedürfnissen
  • Urlaubspolitik — 26 Urlaubstage plus 1 Tag pro Beschäftigungsjahr (maximal 30 Tage), sowie Feiertage am 24. und 31. Dezember
  • 100% Remote Möglichkeit — Möglichkeit zur vollständigen Remote-Arbeit für Bewerber mit EU-Aufenthaltserlaubnis
  • Homeoffice-Budget — 1000€ für die Einrichtung eines idealen Remote-Arbeitsplatzes
  • Equipment — Bereitstellung eines Laptops (Lenovo oder Mac)
  • Discounts — Rabatte wie Urban Sports Club Mitgliedschaft je nach Standort

Das Unternehmen hat Büros in Berlin, München, Paris und Zagreb und fördert aktiv eine diverse und inklusive Arbeitsumgebung.

Deine Benefits im Überblick

Flexible Arbeitszeiten
26-30 Urlaubstage
100% Remote Möglichkeit
1000€ Homeoffice-Budget
Laptop gestellt (Lenovo oder Mac)
Rabatte wie Urban Sports Club

Häufige Fragen zu dieser Stelle

Welche Voraussetzungen muss ich für diese Position erfüllen?

Du solltest über fundierte Python-Kenntnisse, Erfahrung in Data Engineering oder KI-Entwicklung und Kenntnisse in RAG-Systemen verfügen. Englischkenntnisse auf C2-Niveau sind erforderlich. Ein EU-Aufenthaltserlaubnis in Österreich, Kroatien, Deutschland, Polen oder Slowakei ist für die Remote-Arbeit notwendig.

Wie läuft die Bewerbungsprozess bei Noxtua ab?

Du kannst dich über das Online-Bewerbungsformular auf der Webseite bewerben. Noxtua erwartet ein vollständiges CV und relevante Projektbeispiele aus deiner bisherigen Karriere im Bereich Data Engineering oder AI. Nach der Anmeldung kontaktiert das Recruiting-Team dich für ein erstes Gespräch.

Welche Technologie wird im Tagesgeschäft eingesetzt?

Das Tech-Stack umfasst Python, XML/Parquet, ElasticSearch, Qdrant, Neo4j, Amazon Neptune, HuggingFace Transformers, NumPy, Pandas, Pydantic, FastAPI, OpenAI, PyTorch, Docker, AWS, Apache Airflow, JIRA, GitHub, Confluence, Slack und MS365.

Wie ist die Teamstruktur bei Noxtua?

Du wirst dein Team mit etwa 5 Data-Experten bilden und eng mit Felix, dem Director of AI & Data Engineering, zusammenarbeiten. Das Team fokussiert sich auf Generative AI, NLP und datenschutzkonforme Machine-Learning-Lösungen im Rechtsbereich.