1.
データベース関連です。問題文から見ていきましょう。
意思決定や計画立案のために、組織内で運用される情報システムやデータベースなどからデータを集めて格納しておく場所を [ A ] と呼ぶ。この [ A ] から、必要なものだけを利用しやすい形式で格納したデータベースを [ B ] と呼ぶ。
データを集めて倉庫のように格納しておくところは、「データウェアハウス」です。Aはデータウェアハウスです。。
そして、データウェアハウスから取り出して、目的のものを利用しやすい形で格納したデータベースを「データマート」といいます。Bはデータマート。
このような構造化されたデータに加えて、IoT 機器や SNS などからの構造化されていないデータを、そのままの形式で格納しておく [ C ] が利用されつつある。膨大なデータを蓄積する必要があるため、比較的安価なパブリッククラウドのオブジェクトストレージに格納される場合が多い。
そのままのいわゆる生データを格納しておくデータベースを、「データレイク」といいます。ドキュメント、画像、音声等のデータをそのまま格納できるのが特徴です。これがC。
収集されたデータの品質を高めるためには、データ形式の標準化や [ D ] が重要である。
正直、あんまりデータクレンジングって言葉を聞いたことがありませんでした。データマイニングは、ビッグデータから、その法則性・規則性を分析する手法です。
そしてデータクレンジングは、これがこの説明の通りの話で、データの正規化・標準化などにより、無駄を削減して品質を高めることです。
以上より、1が正解となります。