Freelance AI Evaluation Engineer (Python/Full-Stack)
Please submit your CV in English and indicate your level of English proficiency.
Mindrift connects specialists with project-based AI opportunities for leading tech companies, focused on testing, evaluating, and improving AI systems. Participation isproject-based, not permanent employment.
What this opportunity involves
You’ll create challenging coding test cases that push AI coding systems to their limits:
- Review and refine realistic coding tasks based on provided production codebases with realistic scope, requirements and information sources
- Write comprehensive functional tests that validate actual end-to-end behavior and edge-cases, not just superficial checks
- Craft “fair but hard” challenges where the AI has all the context it needs, but has to work for it (information scattered across files and external sources, complex reasoning required)
- Analyze AI failures to understand what the model struggles with vs. what it masters
- Iterate based on feedback from expert QA reviewers who score your work on 7 quality criteria
What we look for
This opportunity is a good fit for experienced developers, software engineers, and/or test automation specialists open to part-time, non-permanent projects. Ideally, contributors will have:
- Degree in Computer Science, Software Engineering or related fields
- 5+ years in software development, primarily Python (pytest, async/await, subprocess, file operations)
- Background in Full-Stack development, with an equal focus on building React-based interfaces and robust Back-end systems
- Experience writing tests (functional, integration – not just running them)
- Docker containers (running evaluations locally in containers)
- CI/CD understanding (GitHub Actions as a user: triggers, labels, reading results)
- English proficiency - B2
How it works
Apply → Pass qualification(s) → Join a project → Complete tasks → Get paid
Effort estimate
Tasks for this project are estimated to take 20 hours to complete, depending on complexity. This is an estimate and not a schedule requirement; you choose when and how to work. Tasks must be submitted by the deadline and meet the listed acceptance criteria to be accepted.
Compensation
On this project, contributors can earn up to $50 per hour equivalent , depending on their level and pace of contribution.
Compensation varies across projects depending on scope, complexity, and required expertise. Please note that other projects on the platform may offer different earning levels based on their requirements.
Empfohlene Jobs
Bilanzbuchhalter (m/w/d) - in Stuttgart gesucht!
Für ein etabliertes Unternehmen in Stuttgart suchen wir einen engagierten Bilanzbuchhalter (m/w/d), der unser Team verstärkt. Unser Kunde bietet ein dynamisches Arbeitsumfeld mit einem starken nationa…
Leiter (w/m/d) IT Development (Microsoft Dynamics AX)
Ein erfolgreiches Multichannel-Unternehmen mit über 1000 Mitarbeitern vertreten in neun weiteren Ländern Europas sucht ab sofort für Ihren Hauptsitz in der Nähe von Stuttgart einen Leiter IT im Develo…
Call Agent (m/w/d)
Call Agent (m/w/d) Call Agent (m/w/d) Mein Chef (T.Eilers & Partner) braucht dich für unsere Büros oder Home-Office. Wir sind seit Corona zu 80 % mit unseren Bestandskunden per Videokonferenz …
Praktikant/ Werkstudent (m/w/d) im Bereich Forschung & Entwicklung (mind. 12 Wochen) - ab März 2026
Nachhaltigkeit im Bauen ist längst mehr als ein Buzzword. Es ist ein Wachstumsmarkt mit enormen Karrierechancen. Dass dies heute so ist, daran hat die DGNB einen maßgeblichen Anteil. Als Europas größ…
Sachbearbeiter Immobilienverwaltung (m/w/d) in Teilzeit (20 bis 25 Std.)
Südwest Immobilienverwaltung GmbH betreut Wohn- und Gewerbeimmobilien mit einem regionalen Fokus auf Stuttgart und die umliegenden Landkreise. Wir legen viel Wert auf eine gute Arbeitsatmosphäre. Wir…
SAP ABAP-Entwickler (m/w/d) mit Schwerpunkt SAP FS-ICM
Willkommen bei der VPV! Mit unseren über 190 Jahren Erfahrung sind wir alles andere als von gestern: Mittlerweile schätzen über 1 Million Kunden unsere innovativen Produkte rund um Vorsorge, Vermög…
Servicemitarbeiter (w/m/d)
KFC gehört neben Taco Bell, Pizza Hut und Habit Burger Grill mit mehr als 59.000 Restaurants in über 155 Ländern zu YUM!. Die deutsche Business Unit (Deutschland und die Schweiz) ist ein mehr als 220…
Inbetriebnehmer Gesamtfahrzeug (m/w/d)
Diese Herausforderungen übernimmst du * Inbetriebnahme von Erprobungsfahrzeugen * Flashen und Codieren von Steuergeräten * Erstellung von Softwarekonfigurationen für verschiedene Fahrzeugvarianten * D…
Gruppenleitung Zoo (m/w/d) Großraum Stuttgart
Ein berufliches Zuhause für 5.500 Kolleginnen und Kollegen – und es werden täglich mehr! Durch Qualität, Vielfalt und Kompetenz zum europäischen Marktführer der Garten-Center-Branche. In über 75 Ja…