2024년 3월 업데이트된 테스트 엔진으로 데이터 엔지니어 인증 시험 문제 [Q48-Q63] 연습하기


4.5/5 - (27 투표)

2024년 3월 업데이트된 테스트 엔진으로 데이터 엔지니어 인증 시험 문제 연습하기

84개의 질문과 함께 제공되는 데이터 엔지니어 실제 시험 질문 테스트 엔진 덤프 교육

데이터브릭스 인증 전문 데이터 엔지니어 시험은 데이터브릭스 플랫폼에서 데이터 파이프라인을 설계, 구축 및 유지 관리하는 응시자의 기술을 엄격하고 종합적으로 평가합니다. 데이터 브릭스 공인 전문 데이터 엔지니어 시험은 데이터 저장 및 검색, 데이터 처리, 데이터 변환, 데이터 시각화 등 광범위한 주제를 다룹니다. 응시자는 확장 가능하고 안정적인 데이터 아키텍처를 설계하고 구현하는 능력과 데이터 파이프라인 문제 해결 및 최적화 능력에 대한 시험을 치르게 됩니다.

 

Q48. Unity 카탈로그 기능을 사용하려면 Databricks 작업 공간의 수동 관리/외부 테이블에서 다음 중 어떤 단계를 수행해야 하나요?

 
 
 
 
 

Q49. 다음 중 델타 호수와 레이크하우스에 대한 설명이 맞습니까?

 
 
 
 
 

Q50. 마케팅 팀에서 두 테이블 CUSTOMERS_2021과 CUSTOMERS_2020 사이에 동일한 정보를 가진 고객을 식별하라는 요청을 받고 있습니다. 각 테이블에는 동일한 스키마를 가진 25개의 열이 있으며, 모든 열에서 두 테이블 간에 일치하는 행을 식별하려고 하는데 다음 중 SQL에서 수행할 수 있는 작업은 무엇입니까?

 
 
 
 
 

Q51. 데이터 엔지니어링 팀은 델타 테이블을 쿼리하여 모두 동일한 조건을 충족하는 행을 추출해야 합니다.
그러나 팀은 쿼리가 느리게 실행되는 것을 발견했습니다. 팀은 이미 쿼리의 크기를 조정하여
데이터 파일입니다. 조사 결과, 팀은 조건에 맞는 행이 드물게 위치한다는 결론을 내렸습니다.
를 각 데이터 파일 전체에 적용합니다.
이 시나리오에 따르면 다음 중 쿼리 속도를 높일 수 있는 최적화 기법은 무엇인가요?

 
 
 
 
 

Q52. 데이터 설계자는 레이크하우스의 모든 테이블을 외부 델타 레이크 테이블로 구성하도록 의무화했습니다.
어떤 접근 방식이 이 요구 사항을 충족할 수 있을까요?

 
 
 
 
 

Q53. 다음 중 델타 테이블을 쿼리하는 데 사용할 수 있는 명령은 무엇인가요?

 
 
 
 
 

Q54. 데이터브릭스 제품 아키텍처에서 대화형 노트북 결과는 어디에 저장되나요?

 
 
 
 
 

Q55. 질문-26. 5000개의 컬러볼이 있고 그 중 1200개가 핑크색입니다. 최대
컬러볼 테스트 세트에서 '분홍색' 항목의 비율에 대한 확률 추정치는 얼마인가요?

 
 
 
 
 

Q56. 데이터 엔지니어링 팀은 매일 데이터 완전성을 검토하기 위해 SQL 쿼리를 사용하여 ETL 작업을 모니터링하고 있으며, 쿼리 출력은 여러 대시보드에서 사용되고 있습니다. 다음 중 일정을 설정하고 이 프로세스를 자동화하는 데 사용할 수 있는 ap-프로세스는 무엇인가요?

 
 
 
 
 

Q57. 한 데이터 엔지니어링 관리자는 Databricks SQL 대시보드의 각 쿼리마다 몇
수동으로 '새로 고침' 버튼을 클릭하면 업데이트하는 데 몇 분이 걸립니다. 그 이유가 무엇인지 궁금해합니다.
발생하면 팀원이 지연이 발생하는 이유에 대한 다양한 이유를 제공합니다.
다음 중 대시보드 업데이트에 몇 분이 걸리는 이유를 설명할 수 없는 이유는 무엇인가요?

 
 
 
 
 

Q58. 외부 파일에 대한 직접 쿼리 제한 옵션, 헤더 및 파이프로 구분된 CSV 파일에 대한 외부 테이블 생성, 빈칸을 채워 테이블 생성 문 CREATE TABLE sales(id int, unitsSold int, price FLOAT, items STRING)를 완성합니다.
________
________
위치 "dbfs:/mnt/sales/*.csv"

 
 
 
 
 

Q59. 세 가지 이벤트가 있다고 가정할 때 어떤 공식이 항상 P(E1|E2,E3)와 같아야 할까요?

 
 
 
 
 

Q60. 데이터 엔지니어링 팀의 한 주니어 멤버가 데이터브릭스 노트북의 언어 상호 운용성을 탐구하고 있습니다. 아래 코드의 의도된 결과는 아프리카 대륙의 국가에서 발생한 모든 매출에 대한 뷰를 등록하는 것입니다.
코드를 실행하기 전에 현재 데이터베이스에서 SHOWTABLES를 실행하면 데이터베이스에 geo_lookup과 sales라는 두 개의 테이블만 포함되어 있음을 알 수 있습니다.

다음 중 대화형 전자 필기장에서 이러한 명령 셀을 순서대로 실행한 결과를 올바르게 설명하는 문장은?

 
 
 
 
 

Q61. 동료가 이전 버전을 저장하기 위해 _bkp로 노트북을 수동으로 복사하는 것을 발견하셨는데, 다음 중 어떤 기능을 대신 추천하시겠습니까?

 
 
 
 

Q62. 데이터 엔지니어가 테이블에서 읽고 데이터를 조작한 다음
를 사용하여 새 테이블에 스트리밍 쓰기를 수행합니다. 데이터 엔지니어가 사용하는 코드 블록은 다음과 같습니다:
(spark.table("sales")
.withColumn("avg_price", col("sales") / col("units"))
3. .writeStream
.option("체크포인트 위치", 체크포인트 경로)
.outputMode("완료")
6. ._____
.table("new_sales")
8.)
데이터 엔지니어가 쿼리에서 사용 가능한 모든 데이터를 처리하기 위해 단일 마이크로 배치만 실행하기를 원하는 경우,
데이터 엔지니어가 빈칸을 채우기 위해 다음 중 어떤 코드 줄을 사용해야 합니까?

 
 
 
 
 

Q63. 델타 라이브 테이블이 표준 데이터 파이프라인에 비해 ELT 파이프라인에 제공하는 이점은 다음 중 어느 것입니까?
데이터브릭스에서 스파크와 델타레이크를 활용하고 있나요?

 
 
 
 
 

데이터 엔지니어링, 데이터 관리, ETL 및 데이터 처리 경험이 있는 전문가와 학생은 데이터 브릭스 공인 전문 데이터 엔지니어 인증 시험에 응시할 수 있습니다. 시험 준비는 데이터브릭스 데이터 엔지니어링 자격증 준비 과정, 온라인 데이터브릭스 문서, 검증된 교육 제공업체의 책과 동영상 등 다양한 학습 자료와 같은 온라인 교육 과정을 통해 할 수 있습니다.

 

데이터 브릭스 인증 전문가 데이터 엔지니어 실제 문제 답변 PDF 100% 커버 실제 시험 문제: https://www.dumpsmaterials.com/Databricks-Certified-Professional-Data-Engineer-real-torrent.html

         

댓글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

아래 이미지에서 텍스트를 입력합니다.