Betreft het een test run of een demo-omgeving? Upload dan geen echte gegevens, maar altijd fictieve data.
1. Log in op je account en zorg ervoor dat je je in het tabje "Data" bevindt. Zoek de knop "+ Databron" en klik erop om het upload proces te starten.
2. Vul de gegeven velden in, voeg een beschrijvende naam toe voor de gegevensbron. Zorg ervoor dat de naam duidelijk het type dataset vertegenwoordigt, omdat dit helpt bij het begrijpen van het doel ervan door samenwerkers. Je kunt optioneel ook een beschrijving geven voor meer context.
3. Kies vervolgens het scheidingsteken dat de waarden in het bestand scheidt. Je kunt kiezen tussen een komma of een puntkomma als scheidingsteken. Klik nadat je een keuze hebt gemaakt op de knop "Importeer CSV-bestand" om door te gaan (je kunt het .csv-bestand ook eenvoudig naar het aangegeven gebied slepen en neerzetten).

4. Nu kun je op jouw lokale systeem bladeren om het gewenste .csv-bestand te selecteren. Nadat je het CSV-bestand hebt geselecteerd, klik je op de knop "Openen". Het bestand wordt nu geüpload.
Let op met de grootte van datasets:
De limiet voor het importeren van data hangt af van je machine, omdat versleuteling lokaal op je machine gebeurt. Versleuteling kan de bestandsgrootte flink vergroten, vooral bij tekst-zware datasets, wat zorgt voor langere verwerkingstijden.
Ook missende waarden kunnen leiden tot tragere versleuteling. Zelfs als het originele bestand kleiner is, moeten missende waarden alsnog op een bepaalde manier worden weergegeven in het versleutelde bestand. Hierdoor kan het versleutelde bestand uiteindelijk groter worden, wat de verwerkingstijd verlengt.
Bijvoorbeeld, op een MacBook Pro versie oktober 2023 (M3 Pro, 18GB RAM):
Originele datasets (zonder missende waarden):
- 134MB (tekstzwaar, 1 miljoen rijen x 22 kolommen) → 701MB versleuteld, ~2m45s
- 250MB (tekstzwaar, 2 miljoen rijen x 14 kolommen) → 1,56GB versleuteld, ~5m55s
- 440MB (voornamelijk numeriek, 3,7 miljoen rijen x 12 kolommen) → 480MB versleuteld, ~2m10s
- 134MB (bestandsgrootte is 119MB) → 930,79MB versleuteld, 6m32s
- 250MB (bestandsgrootte is 209MB) → 1,82GB versleuteld, 13m09s
- 440MB (bestandsgrootte is 360MB) → 959MB versleuteld, 9m02s
5. Nadat het bestand is geüpload, heb je de mogelijkheid om kolomnamen te bewerken. Je kunt ook kiezen of je bepaalde kolommen in je dataset niet mee wil nemen. Standaard worden alle kolommen automatisch geselecteerd.

6. Klik ten slotte op de knop "Versleutelen" om de upload van het .csv-bestand naar de Engine te voltooien.

7. Controleer of jouw CSV-bestand geupload is.
De data is nu versleuteld (secret-shared) over verschillende servers, en beschikbaar om te worden verwerkt in een crandas script. Als data-aanbieder kun je het bestand ook verwijderen op elk moment.