Data Engineer Interview Questions

Data Engineer Interview Questions

Data engineers zijn IT-professionals en zijn in bijna elke bedrijfstak nodig. Data engineers volgen gegevenstrends voor het vaststellen van de beste vervolgstappen voor bedrijven. Een cruciaal onderdeel van het werk van een data engineer bestaat uit het verwerken van ruwe gegevens tot bruikbare gegevens door datapipelines te creëren en gegevenssystemen te bouwen.

Meest gestelde sollicitatievragen voor een data engineer (M/V/X) en hoe te antwoorden

Question 1

Vraag 1: Kunt u tot in detail uw kennisniveau van programmeertalen omschrijven?

How to answer
Zo antwoordt u: Bekijk vóór het sollicitatiegesprek uw cv en/of portfolio en maak een lijst van de programma's waar u het meest bekwaam in bent. Als het u duidelijk wordt dat u voor een programma dat het bedrijf voornamelijk gebruikt, niet de benodigde expertise in huis hebt, beschrijf uzelf dan als een zeer gemotiveerd, zelfstandig persoon die zich onvermoeibaar zal inzetten om deze programma's te leren.
Question 2

Vraag 2: Leg in uw eigen woorden uit wat data engineering inhoudt.

How to answer
Zo antwoordt u: Leg uit wat uw rol is in relatie tot de bredere organisatie en in relatie tot andere rollen zoals die van data scientists om uw bijdrage aan het totale bedrijfssysteem duidelijk te maken. Verduidelijk het verschil tussen een op de database gerichte engineer en een op de pipeline gerichte engineer.
Question 3

Vraag 3: Kunt u uw ervaring met Apache Hadoop en databeheer in een cloudomgeving beschrijven?

How to answer
Zo antwoordt u: Bereid u voor op deze vraag door informatie te zoeken over de software van het bedrijf, producten voor gegevensopslag in de cloud en het gebruik van Apache Hadoop. Data engineers moeten kunnen werken met programmeertalen en gegevensbeheersystemen die overal in de bedrijfstak worden gebruikt, zoals Apache Hadoop.

20,956 data engineer interview questions shared by candidates

Please use the awswrangler module to create a list of the files in the input folder that are not in the output folder. There is an AWS S3 bucket with two folders. Here is the initial code: import awswrangler as wr input_folder = 's3://mf-pythontest/in' output_folder = 's3://mf-pythontest/out' Using the AWS wrangler module, please create a list of the files in the input folder that are not in the output folders. The Required output is: ['doc_003.parquet']You must use the awswrangler package: https://github.com/awslabs/aws-data-wranglerYou will need to have some AWS credentials to access this public bucket. ***TIP*** The solution should have no more than three lines of code
avatar

Data Engineer

Interviewed at Common Code

4.6
Aug 3, 2020

Please use the awswrangler module to create a list of the files in the input folder that are not in the output folder. There is an AWS S3 bucket with two folders. Here is the initial code: import awswrangler as wr input_folder = 's3://mf-pythontest/in' output_folder = 's3://mf-pythontest/out' Using the AWS wrangler module, please create a list of the files in the input folder that are not in the output folders. The Required output is: ['doc_003.parquet']You must use the awswrangler package: https://github.com/awslabs/aws-data-wranglerYou will need to have some AWS credentials to access this public bucket. ***TIP*** The solution should have no more than three lines of code

Viewing 221 - 230 interview questions

Glassdoor has 20,956 interview questions and reports from Data engineer interviews. Prepare for your interview. Get hired. Love your job.