
AI 기술 발전이 촉발한 데이터 폭증으로 인해, 예상치 못하게 구형 하드 드라이브(HDD)의 가치가 급등하는 현상이 나타나고 있다. 챗GPT나 소라(Sora) 같은 생성형 AI 모델 훈련에는 막대한 양의 데이터가 필요하며, AI가 생성하는 콘텐츠 또한 기하급수적으로 증가하면서 저장 공간에 대한 수요가 폭발적으로 늘고 있다. 이러한 상황 속에서, 왜 구형 HDD가 다시 주목받게 되었는지 심층적으로 분석해 본다.
Table of Contents
AI 데이터 폭증과 저장장치 요구사항 변화
- AI 모델 훈련에는 텍스트, 이미지, 비디오 등 다양한 형태의 대용량 데이터가 필요하며, 특히 딥러닝 모델은 동일 데이터를 수천 번 반복 학습한다.
- 기업들은 막대한 클라우드 비용 부담으로 자체 데이터센터 구축을 고려하지만, 고가의 SSD만으로는 감당하기 어려운 저장 공간의 물리적 한계에 직면한다.
- AI 생성 콘텐츠의 폭발적인 증가와 저작권 관련 법적 규제 강화로 인해, 데이터를 삭제하지 못하고 무한정 보존해야 하는 상황이 발생하면서 저장 공간 부족 현상이 심화되고 있다.
- 데이터 유형별로 요구되는 저장장치가 다르다. 텍스트 데이터는 NVMe SSD, 이미지/비디오 데이터는 고용량 HDD, 로그/아카이브 데이터는 구형/저속 HDD가 적합하다.
HDD의 재발견: 가성비와 콜드 스토리지
- AI 데이터센터 관점에서 SSD는 속도는 빠르지만 가격이 비싸고, HDD는 속도는 느리지만 용량 대비 가격이 저렴하다는 장점이 있다.
- AI 학습이 완료된 모델이나 원본 소스 데이터처럼 자주 사용하지 않는 데이터는 ‘콜드 스토리지’에 보관하는 것이 효율적이다.
- HDD는 순차 읽기/쓰기 성능이 뛰어나, AI 학습용 데이터처럼 대용량 파일을 처음부터 끝까지 읽어 들이는 작업에 적합하다.
- 최신 HDD 기술은 단일 드라이브에서 20TB 이상의 용량을 제공하며, RAID 구성을 통해 속도 문제를 상쇄할 수 있다.
공급망 문제와 중고 HDD 시장의 부상
- AI 붐으로 인해 반도체 파운드리 라인이 AI 칩 생산에 집중되면서, HDD에 필요한 컨트롤러 칩 등 부품 수급이 지연되고 신규 HDD 생산에 차질이 발생하고 있다.
- 신제품 부족과 가격 상승으로 인해 중고 HDD 시장이 활성화되고 있으며, 데이터센터들은 비용 절감을 위해 검증된 중고 HDD를 대량으로 매입하고 있다.
- 개인 사용자들 사이에서도 NAS 구축을 위해 가성비 좋은 중고 HDD를 찾는 수요가 증가하고 있다.
원문에서는 더 상세한 사진과 구체적인 수치 데이터를 확인할 수 있다.
—
💬 더 많은 인사이트는 블로그에서 확인하세요
원작자 ‘넘어진곰’의 최신 기술 소식과 직접 소통하기
참고 원문: 오래된 하드 드라이브의 가치가 급등하는 이유: AI가 불러온 저장장치 부족 사태
본 포스팅은 관련 정보를 바탕으로 재구성된 전문 분석입니다.
