혼란을 극복하기: 데이터 웨어하우스 vs. 데이터 레이크 vs. 데이터 레이크하우스
게시 됨: 2022-03-11데이터 스프롤을 활용하기 위해 고군분투하는 산업 전반의 CIO는 어려운 과제에 직면해 있습니다. 그 중 하나는 강력한 데이터 분석을 제공하기 위해 기업의 모든 데이터를 저장할 위치입니다.
전통적으로 데이터를 위한 두 가지 스토리지 솔루션인 데이터 웨어하우스와 데이터 레이크가 있었습니다.
데이터 웨어하우스는 주로 운영 및 트랜잭션 시스템에서 변환되고 구조화된 데이터를 저장하며 이 기록 데이터에 대한 빠르고 복잡한 쿼리에 사용됩니다.
데이터 레이크는 반정형 및 비정형 데이터를 포함한 모든 종류의 데이터를 저장하는 덤프 역할을 합니다. 라이브 데이터 처리 또는 기계 학습을 위한 스트리밍 분석과 같은 고급 분석을 지원합니다.
역사적으로 데이터 웨어하우스는 유지 관리 기술과 별도로 스토리지 공간과 컴퓨팅 리소스에 대한 비용을 지불해야 했기 때문에 롤아웃하는 데 비용이 많이 들었습니다. 스토리지 비용이 감소함에 따라 데이터 웨어하우스가 더 저렴해졌습니다. 일부에서는 데이터 레이크(전통적으로 더 비용 효율적인 대안)가 이제 죽었다고 생각합니다. 일부에서는 데이터 레이크가 여전히 유행이라고 주장합니다. 한편, 다른 사람들은 새로운 하이브리드 데이터 스토리지 솔루션인 데이터 레이크하우스에 대해 이야기하고 있습니다.
그들 각각은 무엇입니까? 자세히 살펴보겠습니다.
이 블로그에서는 데이터 웨어하우스, 데이터 레이크, 데이터 레이크하우스, 인기 있는 기술 스택 및 사용 사례 간의 주요 차이점을 살펴봅니다. 또한 이것은 까다롭지만 회사에 적합한 솔루션을 선택하기 위한 팁을 제공합니다.
데이터 웨어하우스란 무엇입니까?
데이터 웨어하우스는 구조화되고 선별된 데이터를 저장하고 테이블과 열에 데이터 세트를 구성하도록 설계되었습니다. 이 데이터는 기존 비즈니스 인텔리전스, 대시보드 및 보고를 위해 사용자가 쉽게 사용할 수 있습니다.
데이터 웨어하우스 아키텍처
3계층 아키텍처는 데이터 웨어하우스 설계에 가장 일반적으로 사용되는 접근 방식입니다. 구성:
- 맨 아래 계층: 다양한 소스에서 데이터를 로드하는 데 사용되는 데이터 웨어하우스의 스테이징 영역 및 데이터베이스 서버입니다. ETL(추출, 변환 및 로드) 프로세스는 데이터를 데이터 웨어하우스로 푸시하는 전통적인 접근 방식입니다.
 - 중간 계층: 빠른 계산을 위해 데이터를 다차원 형식으로 재구성하는 OLAP(온라인 분석 처리)용 서버
 - 최상위 계층: 데이터 작업을 위한 API 및 프런트엔드 도구
 
그림 1: 데이터 웨어하우스 참조 아키텍처

언급해야 하는 데이터 웨어하우스의 다른 세 가지 중요한 구성 요소가 있습니다. 데이터 마트, 운영 데이터 저장소 및 메타데이터입니다. 데이터 마트는 최하위 계층에 속합니다. 개별 비즈니스 라인에 서비스를 제공하는 데이터 웨어하우스 데이터의 하위 집합을 저장합니다.
운영 데이터 저장소는 간단한 쿼리를 기반으로 하는 운영 보고를 위해 조직의 최신 데이터에 대한 스냅샷을 제공하는 리포지토리 역할을 합니다. 데이터 소스와 데이터 웨어하우스 사이의 중간 계층으로 사용될 수 있습니다.
또한 메타데이터(데이터 웨어하우스 데이터를 설명하는 데이터)가 있으며 이 데이터는 특수 목적 리포지토리와 최하위 레이어에 저장됩니다.
데이터 웨어하우스의 진화와 기술
데이터 웨어하우스는 수십 년 동안 존재해 왔습니다.
전통적으로 데이터 웨어하우스는 온프레미스에서 호스팅되었습니다. 즉, 기업은 유료 또는 오픈 소스 시스템에서 모든 하드웨어를 구입하고 소프트웨어를 로컬로 배포해야 했습니다. 또한 데이터 웨어하우스를 유지 관리하기 위해 전체 IT 팀이 필요했습니다. 긍정적인 측면에서, 기존 데이터 웨어하우스는 지연 문제 없이 빠른 통찰력 확보, 100% 개인 정보 보호 및 최소화된 보안 위험과 함께 데이터를 완벽하게 제어하고 있습니다.
클라우드 편재성을 통해 많은 조직이 이제 모든 데이터가 클라우드에 저장되는 클라우드 데이터 웨어하우스 솔루션으로 마이그레이션하기로 선택합니다. 일종의 통합 쿼리 엔진을 사용하여 클라우드에서도 분석됩니다.
시장에는 다양한 클라우드 데이터 웨어하우스 솔루션이 구축되어 있습니다. 각 제공업체는 고유한 창고 기능 세트와 다양한 가격 모델을 제공합니다. 예를 들어 Amazon Redshift는 기존 데이터 웨어하우스로 구성됩니다. 눈송이도 비슷합니다. Microsoft Azure는 SQL 데이터 웨어하우스인 반면 Google BigQuery는 Amazon Redshift와 같은 인프라나 서비스로서의 플랫폼이 아니라 본질적으로 서비스로서의 소프트웨어(SaaS)를 제공하는 서버리스 아키텍처를 기반으로 합니다.
잘 알려진 온프레미스 데이터 웨어하우스 솔루션에는 IBM Db2, Oracle Autonomous Database, IBM Netezza, Teradata Vantage, SAP HANA 및 Exasol이 있습니다. 클라우드에서도 사용할 수 있습니다.
클라우드 기반 데이터 웨어하우스는 물리적 서버를 구입하거나 배포할 필요가 없기 때문에 분명히 저렴합니다. 사용자는 필요에 따라 저장 공간과 컴퓨팅 성능에 대해서만 비용을 지불합니다. 클라우드 솔루션은 또한 확장하거나 다른 서비스와 통합하기가 훨씬 쉽습니다.
최고의 데이터 품질과 빠른 통찰력으로 매우 구체적인 비즈니스 요구 사항을 충족하는 데이터 웨어하우스는 오랫동안 유지될 것입니다.
데이터 웨어하우스 사용 사례
데이터 웨어하우스는 페타바이트 및 페타바이트의 과거 데이터에 대한 고속 고성능 분석을 제공합니다.
기본적으로 BI 유형 쿼리용으로 설계되었습니다. 데이터 웨어하우스는 예를 들어 특정 기간의 매출, 지역 또는 부서별로 그룹화된 매출, 전년 대비 매출 변동에 대한 답변을 제공할 수 있습니다. 데이터 웨어하우스의 주요 사용 사례는 다음과 같습니다.
- 비즈니스 성과를 보여주는 트랜잭션 보고
 - 독립형 및 "일회성" 비즈니스 과제에 대한 답변을 제공하기 위한 임시 분석/보고
 - 복잡한 현실 세계의 문제를 해결하기 위해 데이터에서 유용한 지식과 숨겨진 패턴을 추출하는 데이터 마이닝
 - 데이터 시각화를 통한 다이내믹한 프레젠테이션
 - 세부 정보를 위해 데이터의 계층적 차원을 통해 드릴다운
 
운영 데이터베이스 외부에서 쉽게 액세스할 수 있는 하나의 위치에 구조화된 비즈니스 데이터를 보유하는 것은 데이터 성숙도가 높은 기업에게 매우 중요합니다.
그러나 기존 데이터 웨어하우스는 빅 데이터 기술을 지원하지 않습니다.
또한 일괄적으로 업데이트되며 모든 소스의 레코드가 한 번에 주기적으로 처리됩니다. 즉, 분석을 위해 롤업될 때 데이터가 부실해질 수 있습니다. 데이터 레이크는 이러한 제약을 해결하는 것 같습니다. 절충안으로. 탐색해 봅시다.
데이터 레이크란?
데이터 레이크는 대부분 정제되지 않은 원시 데이터를 원래 형태로 수집합니다. 데이터 레이크와 데이터 웨어하우스의 또 다른 주요 차이점은 데이터 레이크가 이 데이터를 스키마라고 하는 논리적 관계로 정렬하지 않고 저장한다는 것입니다. 그러나 이것이 더 정교한 분석을 가능하게 하는 방법입니다.
데이터 레이크는 (i) ERP, CRM 또는 SCM과 같은 비즈니스 애플리케이션의 트랜잭션 데이터, (ii) .csv 및 .txt 형식의 문서, (iii) XML, JSON 및 AVRO 형식과 같은 반구조화된 데이터, (iv) 장치 로그 및 IoT 센서, (v) 이미지, 오디오, 바이너리, PDF 파일.
데이터 레이크 아키텍처
데이터 레이크는 데이터 저장을 위해 플랫 아키텍처를 사용합니다. 주요 구성 요소는 다음과 같습니다.
- 레이크로 수집된 모든 데이터에 대한 브론즈 영역 입니다. 데이터는 배치 패턴의 경우 그대로 저장되거나 스트리밍 워크로드의 경우 집계된 데이터 세트로 저장됩니다.
 - 비즈니스 요구 사항에 따라 탐색을 위해 데이터가 필터링되고 강화되는 실버 존
 - BI 도구 및 ML 알고리즘을 적용하기 위해 선별되고 잘 구조화된 데이터가 저장되는 골드 존 . 이 영역은 종종 기존 데이터 웨어하우스 및 데이터 마트를 제공하는 운영 데이터 저장소를 특징으로 합니다.
 - 가설 검증 및 테스트를 위해 데이터를 실험할 수 있는 샌드박스 . 이는 Hadoop 또는 기타 NoSQL 기술을 위한 완전히 별도의 데이터베이스 또는 골드 존의 일부로 구현됩니다.
 
그림 2: Data Lake 참조 아키텍처

데이터 레이크에는 본질적으로 분석 기능이 포함되어 있지 않습니다. 그것들이 없으면 그 자체로 유용하지 않은 원시 데이터를 저장합니다. 따라서 조직은 데이터 웨어하우스를 구축하거나 데이터 레이크 위에 다른 도구를 활용하여 데이터를 사용할 수 있습니다.
데이터 레이크가 데이터 늪으로 바뀌지 않도록 하려면 데이터 레이크 설계에 기본 제공 데이터 거버넌스 및 메타데이터 관리를 포함하는 효율적인 데이터 관리 전략을 갖는 것이 중요합니다. 이상적인 세계에서 데이터 레이크에 있는 데이터는 카탈로그화되고, 인덱싱되고, 검증되어야 하며 데이터 사용자가 쉽게 사용할 수 있어야 합니다. 그러나 이것은 드문 경우이며 많은 데이터 레이크 프로젝트가 실패합니다. 이는 피할 수 있습니다. 데이터 팀의 성숙도에 관계없이 데이터 유효성 검사 및 품질을 적용하기 위해 최소한 필수 제어 장치를 설치하는 것이 중요합니다.
데이터 레이크 진화 및 기술
2000년대 초반 빅 데이터의 부상은 조직에 큰 기회와 큰 도전을 가져다주었습니다. 비즈니스는 빅 데이터의 비즈니스 영향을 포착하기 위해 이처럼 방대하고 지저분하며 엄청나게 빠르게 성장하는 데이터 세트를 분석할 새로운 기술이 필요했습니다.
2008년 Apache Hadoop은 비정형 데이터를 대규모로 수집 및 처리하기 위한 혁신적인 오픈 소스 기술을 제시하여 빅 데이터 분석 및 데이터 레이크를 위한 기반을 마련했습니다. 얼마 후 Apache Spark가 등장했습니다. 사용하기 더 쉬웠습니다. 또한 ML 모델을 구축 및 교육하고 SQL을 사용하여 구조화된 데이터를 쿼리하고 실시간 데이터를 처리하는 기능을 제공했습니다.
오늘날 데이터 레이크는 주로 클라우드 호스팅 리포지토리입니다. AWS, Azure 및 Google과 같은 모든 최고의 클라우드 공급자는 비용 효율적인 개체 스토리지 서비스와 함께 클라우드 기반 데이터 레이크를 제공합니다. 그들의 플랫폼은 배포를 자동화하는 다양한 데이터 관리 서비스와 함께 제공됩니다. 예를 들어 한 시나리오에서 데이터 레이크는 HDFS(Hadoop Distributed File System) 또는 Amazon Redshift와 같은 클라우드 데이터 웨어하우스 솔루션과 통합된 Amazon S3와 같은 데이터 스토리지 시스템으로 구성될 수 있습니다. 이러한 구성 요소는 데이터 처리를 위한 Amazon EMR, 데이터 카탈로그 및 변환 기능을 제공하는 Amazon Glue, Amazon Athena 쿼리 서비스 또는 메타데이터 리포지토리 및 색인을 구축하는 데 사용되는 Amazon Elasticsearch Service를 포함할 수 있는 에코시스템의 서비스와 분리됩니다. 데이터. 로컬 데이터 레이크는 보안, 개인 정보 보호 또는 대기 시간과 같은 일반적인 클라우드 문제로 인해 여전히 일반적입니다.

데이터 레이크용 일부 제품을 제공하는 온프레미스 스토리지 공급업체도 있지만 데이터 레이크 제품은 잘 정의되어 있지 않습니다. 데이터 웨어하우스와 달리 데이터 레이크에는 실제 배포 기간이 몇 년이 되지 않습니다. 데이터 레이크 개념이 흐릿하고 불분명하다는 비판이 여전히 많습니다. 비평가들은 또한 조직에서 원시 데이터에 대해 탐색적 워크로드를 실행할 수 있는 기술(또는 그 문제에 대한 열정)을 가진 사람이 거의 없다고 주장합니다.
데이터 레이크를 모든 기업의 데이터에 대한 중앙 저장소로 사용해야 한다는 생각은 신중하게 접근해야 한다고 그들은 말합니다. 데이터 레이크 일수가 정해져 있다는 도발적인 이야기도 있었습니다. 다음과 같은 이유가 인용됩니다.
- 데이터 레이크는 필요에 따라 컴퓨팅 리소스를 효율적으로 확장할 수 없습니다(처음부터 의도적으로 설계된 것이 아니기 때문입니다).
 - 데이터 레이크는 큰 기술 부채를 안고 있으며 기술적인 이유보다는 마케팅 과대 광고에 의해 주로 생성됩니다(많은 데이터 웨어하우스에서도 마찬가지입니다).
 - 클라우드 데이터 웨어하우스 솔루션의 등장으로 데이터 레이크는 더 이상 상당한 비용 이점을 제공하지 않습니다(비용 문제는 컴퓨팅 비용을 예측하기 어렵기 때문에 그렇게 간단하지 않습니다).
 
그러한 비판은 젊은 기술의 본질적인 부분입니다. 그러나 데이터 레이크에는 스트리밍 분석과 같은 명확한 사용 사례가 있습니다. 그러나 아직까지는 데이터 웨어하우스를 위협하지 않습니다. 어느 시점에서 데이터 레이크는 데이터 웨어하우스를 능가하기까지 하여 저장된 데이터 측면에서 보다 광범위한 분석 기능, 비용 효율성 및 유연성을 제공했습니다. 그러나 데이터 웨어하우스 기술이 성숙함에 따라 많은 사람들이 현재 확실한 승자가 없다는 데 동의합니다. 일반적으로 둘 다 유지하거나 하이브리드 아키텍처로 이동하는 것이 좋습니다. 읽어.
데이터 레이크 사용 사례
데이터 레이크에 대한 주요 아이디어는 가능한 한 빨리 모든 소스에서 사용 가능한 모든 데이터에 대한 비즈니스 액세스를 제공하는 것입니다. 데이터 레이크는 어제 있었던 일에 대한 그림만 제공하지 않습니다. 방대한 양의 데이터를 저장하는 데이터 레이크는 조직이 현재(스트리밍 분석 사용)와 미래(예측 분석 및 기계 학습을 포함한 빅 데이터 솔루션 사용)에 대해 더 많이 알 수 있도록 설계되었습니다. 데이터 레이크의 주요 사용 사례는 다음과 같습니다.
- 엔터프라이즈 데이터 웨어하우스에 데이터세트 제공
 - 스트림 분석 수행
 - ML 프로젝트 구현
 - Tableau 또는 MS Power BI와 같은 오래된 엔터프라이즈 BI 도구를 사용하여 고급 분석 차트 작성
 - 맞춤형 데이터 분석 솔루션 구축
 - 데이터 팀이 문제를 근본 원인으로 추적할 수 있는 근본 원인 분석 실행
 
원시 데이터를 분석 환경으로 이동하는 강력한 데이터 엔지니어링 기술을 통해 데이터 레이크는 매우 관련성이 높을 수 있습니다. 이를 통해 팀은 데이터가 어떻게 유용할 수 있는지 이해하기 위해 데이터를 실험할 수 있습니다. 여기에는 데이터를 살펴보고 새로운 방식으로 데이터를 보기 위해 다양한 스키마를 시도하는 모델을 구축하는 것이 포함될 수 있습니다. 또한 데이터 레이크는 웹 로그 및 IoT 센서에서 유입되는 스트림 데이터와의 랭글링을 허용하며 기존 데이터 웨어하우스 접근 방식에는 적합하지 않습니다.
간단히 말해서, 데이터 레이크를 통해 조직은 패턴을 발굴하고, 변화를 예측하거나, 신제품 또는 현재 프로세스와 관련된 잠재적인 비즈니스 기회를 찾을 수 있습니다. 다양한 비즈니스 요구에 사용되는 데이터 레이크와 데이터 웨어하우스는 종종 함께 구현됩니다. 다음 데이터 스토리지 개념으로 이동하기 전에 데이터 웨어하우스와 데이터 레이크 간의 주요 차이점을 빠르게 요약해 보겠습니다.
데이터 웨어하우스와 데이터 레이크

새로운 하이브리드 아키텍처인 데이터 레이크하우스는 어떻습니까?
마케팅은 차치하고 데이터 레이크하우스에 대한 핵심 아이디어는 데이터 레이크에 컴퓨팅 성능을 제공하는 것입니다. 구조적으로 데이터 레이크하우스는 일반적으로 다음으로 구성됩니다.
- 데이터를 개방형 형식(예: Parquet)으로 저장하기 위한 스토리지 계층 . 이 계층은 데이터 레이크라고 할 수 있으며 컴퓨팅 계층과 분리되어 있습니다.
 - 메타데이터 관리, 인덱싱, 스키마 시행 및 ACID(Atomicity, Consistency, Reliability, Durability) 트랜잭션을 지원하는 조직 웨어하우스 기능을 제공하는 컴퓨팅 계층
 - 데이터 자산에 액세스하기 위한 API 계층
 - 보고에서 BI, 데이터 과학 또는 기계 학습에 이르기까지 다양한 워크로드를 지원하는 서비스 계층 .
 
그림 3: Data Lakehouse 참조 아키텍처

두 세계의 장점을 결합한 솔루션으로 선전된 데이터 레이크하우스는 다음 두 가지를 모두 해결합니다.
- 정형 및 비정형 데이터 모두에 의존하는 고급 데이터 분석의 지원 부족과 컴퓨팅 리소스에서 스토리지를 분리하지 않는 기존 데이터 웨어하우스의 상당한 확장 비용을 포함한 데이터 웨어하우스 제약
 - 데이터 복제, 데이터 품질, 다양한 작업을 위해 여러 시스템에 액세스하거나 분석 도구와 복잡한 통합을 구현해야 하는 필요성을 포함한 데이터 레이크 문제
 
데이터 레이크하우스는 데이터 분석 분야의 새로운 발전입니다. 이 개념은 Snowflake 플랫폼과 관련하여 2017년에 처음 사용되었습니다. 2019년, AWS는 데이터 웨어하우스 서비스 Amazon Redshift의 사용자가 Amazon S3에 저장된 데이터를 검색할 수 있는 Amazon Redshift Spectrum 서비스를 설명하기 위해 데이터 레이크하우스라는 용어를 사용했습니다. 2020년에는 데이터 레이크하우스라는 용어가 널리 사용되었으며 Databricks는 Delta Lake 플랫폼에 이 용어를 채택했습니다.
데이터 레이크하우스는 다양한 산업 분야의 기업들이 AI를 도입하여 서비스 운영을 개선하고, 혁신적인 제품과 서비스를 제공하거나, 마케팅 성공을 주도함에 따라 밝은 미래를 맞이할 수 있습니다. 데이터 웨어하우스에서 제공하는 운영 체제의 구조화된 데이터는 스마트 분석에 적합하지 않은 반면 데이터 레이크는 강력한 거버넌스 관행, 보안 또는 ACID 규정 준수를 위해 설계되지 않았습니다.
데이터 레이크 대 데이터 레이크하우스

따라서 데이터 웨어하우스 vs. 데이터 레이크 vs. 데이터 레이크하우스: 무엇을 선택해야 할까요?
데이터 스토리지 솔루션을 처음부터 구축하거나 레거시 시스템을 현대화하여 ML을 지원하거나 성능을 개선하려는 경우 정답은 쉽지 않습니다. 공급업체의 제품 및 가격 모델이 빠르게 발전함에 따라 주요 차이점, 이점 및 비용에 대해 여전히 많은 혼란이 있습니다. 게다가 이해관계자의 동의가 있더라도 항상 어려운 프로젝트입니다. 그러나 데이터 웨어하우스와 데이터 레이크, 데이터 레이크하우스를 선택할 때 몇 가지 주요 고려 사항이 있습니다.
대답해야 하는 주요 질문은 다음과 같습니다. WHY. 여기서 기억해야 할 좋은 점은 데이터 웨어하우스, 레이크 및 레이크하우스 간의 주요 차이점은 기술에 있지 않다는 것입니다. 그들은 다양한 비즈니스 요구를 충족시키는 것에 관한 것입니다. 그렇다면 처음에 데이터 스토리지 솔루션이 필요한 이유는 무엇입니까? 정기 보고, 비즈니스 인텔리전스, 실시간 분석, 데이터 과학 또는 기타 정교한 분석을 위한 것입니까? 데이터 일관성이나 적시성이 비즈니스 요구 사항에 더 중요합니까? 사용 사례를 개발하는 데 시간을 할애하십시오. 분석 요구 사항은 잘 정의되어야 합니다. 사용자와 스킬셋도 깊이 이해해야 합니다. 몇 가지 경험 법칙은 다음과 같습니다.
- 정확한 질문이 있고 정기적으로 얻고자 하는 분석 결과를 알고 있는 경우 데이터 웨어하우스가 좋습니다.
 - 의료나 보험과 같이 규제가 엄격한 산업에 종사하는 경우 무엇보다도 광범위한 보고 규정을 준수해야 할 수 있습니다. 따라서 데이터 웨어하우스가 더 나은 선택이 될 것입니다.
 - KPI 및 보고 요구 사항을 간단한 이력 분석으로 해결할 수 있다면 데이터 레이크 또는 하이브리드 솔루션은 과도할 것입니다. 대신 데이터 웨어하우스를 사용하십시오.
 - 데이터 팀이 실험 및 탐색적 분석을 수행하는 경우 데이터 레이크 또는 하이브리드 솔루션을 선택하십시오. 그러나 비정형 데이터로 작업하려면 강력한 데이터 분석 기술이 필요합니다.
 - 머신 러닝 기술을 활용하려는 성숙한 데이터 조직이라면 하이브리드 솔루션 또는 데이터 레이크가 적합할 것입니다.
 
예산과 시간 제약도 고려하십시오. 데이터 레이크는 확실히 데이터 웨어하우스보다 구축 속도가 빠르고 아마도 더 저렴할 것입니다. 이니셔티브를 점진적으로 구현하고 확장하면서 기능을 추가할 수 있습니다. 레거시 데이터 스토리지 시스템을 현대화하려면 왜 이것이 필요한지 다시 물어봐야 합니다. 너무 느린가요? 아니면 더 큰 데이터 세트에 대한 쿼리를 실행할 수 없습니까? 일부 데이터가 누락되었습니까? 다른 유형의 분석을 실행하고 싶으십니까? 당신의 조직은 레거시 시스템에 많은 돈을 썼으므로 그것을 버리려면 확실히 강력한 비즈니스 사례가 필요합니다. ROI에도 연결하십시오. 데이터 스토리지 아키텍처는 아직 성숙 단계입니다. 그들이 어떻게 진화할지 확실히 말하는 것은 불가능합니다. 그러나 어떤 경로를 택하든 일반적인 함정을 인식하고 이미 존재하는 기술을 최대한 활용하는 것이 유용합니다.
이 기사를 통해 데이터 웨어하우스와 데이터 레이크, 데이터 레이크하우스에 대한 혼란이 해소되었기를 바랍니다. 여전히 질문이 있거나 데이터 스토리지 솔루션을 구축하기 위한 최고의 기술 또는 조언이 필요한 경우 ITRex에 문의하십시오. 그들은 당신을 도울 것입니다.
2022년 2월 23일 https://itrexgroup.com에 원래 게시되었습니다.
