このページはFree Exams Dumps Materialsからエクスポートされました。 [ http://exams.dumpsmaterials.com ]
Export date: Wed Feb 5 7:42:15 2025 / +0000 GMT

2024年3月Databricks-Certified-Professional-Data-Engineer試験問題集[Q48-Q63]を練習するためのテストエンジンを更新しました。




Databricks-Certified-Professional-Data-Engineer試験問題集を練習するための2024年3月更新のテスト・エンジン

84の質問が付いているDatabricks-Certified-Professional-Data-Engineerの実際の試験問題のテストエンジンのダンプの訓練


Databricks 認定プロフェッショナルデータエンジニア試験は、Databricks プラットフォーム上でのデータパイプラインの設計、構築、および保守に関する受験者のスキルを厳格かつ包括的に評価するものです。Databricks-Certified-Professional-Data-Engineer 試験は、データの保存と検索、データ処理、データ変換、データ可視化など、幅広いトピックをカバーしています。受験者は、スケーラブルで信頼性の高いデータアーキテクチャを設計して実装する能力、およびデータパイプラインのトラブルシューティングと最適化の熟練度をテストされます。

 

Q48. Unityカタログ機能を使用するには、Databricksワークスペースの管理テーブル/外部テーブルで次のどの手順を実行する必要がありますか?

 
 
 
 
 

Q49. デルタ湖とレイクハウスについて正しいのはどれか?

 
 
 
 
 

Q50. あなたはマーケティングチームからの依頼で、2つのテーブルCUSTOMERS_2021とCUSTOMERS_2020の間で同じ情報を持つ顧客を特定する作業を行っています。

 
 
 
 
 

Q51. データ・エンジニアリング・チームは、同じ条件を満たす行を抽出するために、デルタ・テーブルをクエリする必要がある。
しかし、チームはクエリの実行速度が遅いことに気づいた。チームはすでに
のデータファイルである。調査の結果、この条件を満たす行がまばらに配置されていることが判明した。
各データファイルを通して。
シナリオに基づいて、次の最適化テクニックのどれがクエリを高速化できるか?

 
 
 
 
 

Q52. データアーキテクトは、レイクハウスのすべてのテーブルを外部デルタレイクテーブルとして構成することを命じました。
この要件が満たされるようにするためには、どのようなアプローチが有効か?

 
 
 
 
 

Q53. デルタ・テーブルを照会するために使用できるコマンドは次のうちどれですか?

 
 
 
 
 

Q54. インタラクティブ・ノートブックの結果は、Databricks製品アーキテクチャのどこに保存されますか?

 
 
 
 
 

Q55. 問26。5000色のボールがあり、そのうち1200色はピンク色である。最大で
カラーボールのテストセットにおける「ピンク」アイテムの割合の尤度推定値は?

 
 
 
 
 

Q56. データエンジニアリングチームは、ETLジョブを監視するために毎日SQLクエリを使用してデータの完全性をレビューしています。

 
 
 
 
 

Q57. あるデータエンジニアリングマネージャーは、Databricks SQLダッシュボードの各クエリに数秒かかることに気づきました。
手動で "更新 "ボタンをクリックしても、更新に数分かかる。なぜだろうか?
そのため、チームメンバーは遅れが生じている理由についてさまざまな理由を提示する。
ダッシュボードの更新に数分かかる理由を説明できないのは、次のうちどれですか?

 
 
 
 
 

Q58. 外部ファイルへの直接クエリ 限定されたオプション、ヘッダーとパイプで区切られたCSVファイル用の外部テーブルを作成、空白を埋めてテーブル作成ステートメントを完成させる CREATE TABLE sales (id int, unitsSold int, price FLOAT, items STRING)
________
________
LOCATION "dbfs:/mnt/sales/*.csv"

 
 
 
 
 

Q59. 3つの事象があるとして、どの式が常にP(E1|E2,E3)と等しくなければならないか?

 
 
 
 
 

Q60. データエンジニアリングチームの若手メンバーが、Databricksノートブックの言語相互運用性を調査しています。以下のコードの目的は、geo_lookuptable に表示されるアフリカ大陸の国々で発生したすべての販売のビューを登録することです。
コードを実行する前に、現在のデータベースでSHOWTABLESを実行すると、データベースにはgeo_lookupandsalesの2つのテーブルしかないことがわかります。

対話型ノートブックでこれらのコマンドセルを順番に実行した結果を正しく説明している記述はどれか?

 
 
 
 
 

Q61. あなたは、同僚が以前のバージョンを保存するために、_bkpを使ってノートブックを手動でコピーしていることに気づきました。

 
 
 
 

Q62. あるデータエンジニアが、テーブルからの読み取り、データ操作、そして次の処理を行うStructured Streamingジョブを設定した。
新しいテーブルにストリーミング書き込みを実行する。データ・エンジニアが使用するコード・ブロックは以下の通りである:
1. (spark.table("売上")
2. .withColumn("avg_price", col("sales") / col("units"))
3. .writeStream
4. .option("checkpointLocation", checkpointPath)
5. .outputMode("完了")
6. ._____
.table("new_sales")
8.)
データエンジニアが、利用可能なデータをすべて処理するために、クエリに単一のマイクロバッチを実行させたいだけであれば、
データ・エンジニアが空白を埋めるために使用すべきコード行は次のうちどれでしょうか?

 
 
 
 
 

Q63. Delta Live TablesがELTパイプラインに提供する、標準的なデータパイプラインに対する利点は次のうちどれでしょうか?
Databricks上でSparkとDelta Lakeを利用する?