Machine learning training data

Grote en specifieke groepen consumenten voor voice en images

Offerte aanvragen
Telefonisch consult

Artificial intelligence voor jouw organisatie?

Ben jij al bezig om de mogelijkheden te benutten die AI jouw organisatie biedt? Om machine learning goed in te richten heb je training data nodig. Alleen door heel veel te ‘oefenen’ met training data kan het systeem de patronen gaan herkennen en zelf gaan leren. Maar hoe kom je aan die data sets?

Onze klanten lopen tegen de volgende zaken aan

  • Algemene data sets zijn niet specifiek genoeg voor jouw toepassing. Je hebt wel 500 uur aan spraak maar niet over het onderwerp waar je naar op zoek bent.

  • Je hebt exact de juiste klantgesprekken uit het callcenter alleen zitten er allerlei privacy gevoelige elementen in die maken dat het niet als training data voor AI gebruikt kan worden.

  • Het verzamelen van real life training data is kostbaar als het via de gebaande paden gaat. Bijvoorbeeld installateurs die foto’s moeten gaan maken van 1.000 meterkasten.

  • Je hebt de training data wel in Engels en Duits maar niet in andere belangrijke talen.

Cases

138 deelnemers uit 5 dialectgebieden

138 personen afkomstig uit 5 dialect gebieden, die instructies geven aan de board computer van hun auto in een sound studio.  (lees meer over deze case)

1.500 uur aan call center gesprekken

1.500 uur aan call center gesprekken gesimuleerd. We hebben zowel de agent als client kant verzorgd. > 1.000 personen hebben een 20 tal scenario’s doorlopen. (lees meer over deze case)

750 Apple gebruikers spreken zinnen in

750 Apple gebruikers spreken via een app 200 zinnen in.

Welke rol heeft CG Research?

Het panel van CG Research bestaat uit 25.000 Nederlanders die graag mee doen aan marktonderzoek. Zij willen ook andersoortige ‘opdrachten’ doen tegen een kleine vergoeding. Deze panelleden hebben we in 2019 ingezet voor meerdere grote projecten om training data te verzamelen voor machine learning.

Veelvuldig gebruiken onze klanten Nederland als pilot land om daarna de datacollectie uit te rollen in andere landen. CG vervult dan een coördinerende rol en deelt zijn best practices. CG heeft inmiddels training data verzameld in Brazilië, Mexico, Spanje, en de UK. Daarnaast zijn we met onze partners voor kwalitatief onderzoek uitermate goed in staat dat ook nog in vele andere Europese landen te doen en ook in China en India zijn we actief.

Training data verzamelen voor het optimaliseren van:

  • Voice technologie waarbij gebruikers met hun stem interactie kunnen aangaan met jouw device of software.

  • Image Recognition maakt gebruik van kunstmatige intelligentietechnologie om objecten, mensen, plaatsen en acties in afbeeldingen automatisch te identificeren.

  • Sentiment analysis is het geautomatiseerde proces van het begrijpen van een mening over een bepaald onderwerp uit geschreven of gesproken taal.

Mogelijke landen/talen

Europa

  • België
  • Denemarken
  • Duitsland
  • Estland
  • Finland
  • Frankrijk
  • Italië
  • Letland
  • Litouwen
  • Nederland
  • Noorwegen
  • Oostenrijk

  • Polen
  • Portugal
  • Spanje
  • Verenigd Koninkrijk
  • Zweden
  • Zwitserland

Wereldwijd

  • Australië
  • Brazilië
  • Canada
  • China
  • Indonesië
  • Japan
  • Maleisië
  • Mexico
  • Rusland
  • Singapore
  • Thailand
  • Verenigde Staten

Samenwerkingsmogelijkheden bespreken?

CG Research is de ideale partner. Jij bepaalt namelijk welk deel je uitbesteedt of juist in-house doet.

Vrijblijvende offerte aanvragen
Merik te Grotenhuis
Merik te GrotenhuisManaging Director