Ben jij work hard, party harder?

Onze collega Jasper houdt wel van een feestje. Of tien. Maar dan is hij ‘s avonds een vent en ’s ochtends een vent. Jij ook?

Over ons

Collega's maken het verschil. Daarom is het leuker werken bij Bending The Rules. Want naast dat we serieuze software vraagstukken oplossen, zijn wij niet het typische IT bedrijf. Naast programmeurs zijn we ook bevlogen BBQ chefs, bierbrouwers, competitieve gewichtheffers en houden we van een festivalletje. Kortom, we zoeken een leuke collega die ook nog eens echt goed is in zijn werk. Ben jij die persoon?

Yes, ik ben die collega

Wat ga je doen?

Apply now

Deze rol richt zich op het verzamelen, verfijnen en optimaliseren van datasets die worden gebruikt voor het trainen van Large Language Models (LLM). Het hoofddoel is om de kwaliteit, relevantie en diversiteit van de data te waarborgen, met een specifieke focus op de entertainmentindustrie, inclusief tekst, afbeeldingen en andere media.

Jouw belangrijkste verantwoordelijkheden zijn:

  • Datasetcuratie: Verzamelen en beheren van grootschalige, hoogwaardige datasets uit verschillende bronnen binnen de entertainmentindustrie
  • Data Annotatie & Labeling: Ontwikkelen van strategieën voor nauwkeurige labeling, inclusief geautomatiseerde methoden voor het aligneren van tekst en afbeeldingen voor trainingsdoeleinden.
  • Data Cleaning & Voorverwerking: Implementeren van pijplijnen voor het opschonen en voorbewerken van multimodale datasets (bijv. tokenization, beeldvoorverwerking, augmentatie) om consistentie en relevantie te waarborgen.
  • Datakwaliteitsmetingen: Definiëren en bijhouden van metrics om de kwaliteit en relevantie van datasets te beoordelen, zodat continue verfijning en iteratie mogelijk is.
  • Synthetische Datageneratie: Onderzoeken van technieken voor het creëren van synthetische data (bijv. GANs, augmentatie) om leemtes in specifieke entertainmentsubdomeinen of randgevallen op te vullen.

DE VOORDELEN VAN WERKEN BIJ BENDING THE RULES

We starten altijd met een contract van 7 maanden. Waren deze succesvol? Dan belonen wij jou met een vast contract én een loonsverhoging of een lease auto (jij kiest!). Maar, er is meer…

  • Kies voor een werkweek van 32, 36 of 40 uur.
  • Direct meedraaien met een project. Want ja, je hoort er nu gewoon bij.
  • Salaris tussen de €2.800 - en €4.200 bruto (afhankelijk van je ervaring).
  • Jouw mening is goud. Dus deel deze met ons en heb invloed op de mooie resultaten.
  • Nieuwe technologieën. Wij hebben binnen Bending The Rules een duidelijke expertise, maar blijven daarbinnen altijd vernieuwen. Je zult je dan ook constant blijven ontwikkelen.
  • ”Kijkjes in de keuken” van toffe innovatieve bedrijven. Ook daar leer je veel van.
  • Veel leuke uitjes, BBQ voor de lunch, het gezelligste team van Nederland!
Yes, ik ben jullie Data Engineer - Dataset Specialist
Bbq Master Hanco

Onze collega Hanco is een echte Grill Meister. Best Burger in Breda! Heb jij unieke skills? (Naast dat je enorm goed kan programmeren natuurlijk)

Wat je hiervoor moet kunnen

Al zin om aan de bak te gaan? Laten we even de belangrijkste zaken aflopen die jij in huis moet hebben om dit tot een succes te maken:

  • Je hebt expertise in Python, SQL en big data tools (Apache Spark, BigQuery).
  • Je hebt sterke ervaring met data-voorverwerking voor zowel tekstuele als beelddatasets.
  • Je bent bekend met annotatietools en datasetversiebeheersystemen.
  • Je hebt begrip van multimodale leerconcepten en datasetalignement.
Yes, ik ben jullie Data Engineer - Dataset Specialist

Zin om te komen
BBQ'EN
sporten
werken?