您现在的位置是:深圳市东方朗云科技有限公司 > 公司新闻
当货拉拉面临 AI 转型,该如何做大数据存储?
深圳市东方朗云科技有限公司26-05-10【公司新闻】9人已围观
简介货拉拉在面临AI转型时,针对大数据存储问题,采取了以下策略和措施:一、采用混合云存储架构自建+云服务结合:货拉拉目前采用自建基础设施与云服务相结合的混合架构体系,其中99%的数据存储在云上,保留少量自建设施。这种架构既保证了数据的稳定性和安全性,又提高了读写能力。选择适合的云服务商:货拉拉经过评估,选择腾讯云作为主要云...
货拉拉在面临AI转型时,针对大数据存储问题,采取了以下策略和措施:
一、采用混合云存储架构- 自建+云服务结合:货拉拉目前采用自建基础设施与云服务相结合的混合架构体系,其中99%的数据存储在云上,保留少量自建设施。这种架构既保证了数据的稳定性和安全性,又提高了读写能力。
- 选择适合的云服务商:货拉拉经过评估,选择腾讯云作为主要云服务商,利用其稳定性和强大的服务能力,完成了40PB+数据的云上迁移,实现了0故障搬迁。
- 元初-元数据管理平台:针对七天内被误删的数据,通过多层防护实现快速恢复,确保数据100%召回。
- 自研灾备系统Kirk:针对数据勒索和机房灾难,实现PB级数据灾备和全链路灾备,保障核心数据100%不丢失。
- 分桶存储策略:为解决AI大模型训练与传统大数据存储的资源抢占问题,货拉拉采用分桶治理方案:
COS桶1:专用于大数据存储,支撑整个大数据市场相关业务。
COS桶2:专用于AI大模型训练数据存储,避免对离线链路稳定性造成影响。
- 专项优化:通过分桶存储,单个模型下行带宽需求下降8%,后续将逐步迁移AI业务并进行专项优化。
- 腾讯云GooseFS:货拉拉与腾讯云合作,基于GooseFS数据加速器提升AI大模型训练的带宽吞吐能力:
Tbps级吞吐:支持千亿级元数据规模,单链接速度达GBps级别,分发效率提升10倍。
元数据加速能力:通过数据亲和力调度,将数据调度到计算节点更近的本地磁盘,提升数据调用效率。
- 按需配置训练数据:基于COS模式,训练数据持久化存储在COS Data Lake中,通过GooseFS按需拉取到云上或IDC计算端,实现“一份Dataset,多地训练”。
- 统一存储池:COS作为云存储底座,为40PB+数据提供统一存储池,提升系统可用性和可靠性,同时降低存储成本。
- 数据管理(MetaInsight):通过智能检索能力,支持自然语言快速检索海量非结构化数据(如图片、音视频),提升数据管理效率。
- 数据处理(Data Engine):将计算下沉到存储端,提供标准化的图片、音视频处理能力(如压缩、裁剪、水印),优化数据访问性能。
- AI场景应用:
以图搜图:在电商商品搜索中,通过特征提取与索引库对比,快速返回相似商品信息。
智能预分类:在AI大模型训练中,对非结构化数据进行智能分类,减少70%以上预处理时间,支持跨模态检索(如图像+文本描述),高效构建高质量训练集。
- 逐步迁移AI业务:将AI业务逐步迁移至专项优化的存储桶中,进一步提升带宽利用率。
- 深化与腾讯云合作:探索更多数据加速和智能管理方案,应对AI时代数据爆炸式增长的挑战。
很赞哦!(79)