Фото: Artur Widak / NurPhoto via Getty Images
DataWorks 支持在 DLF 或用户自建湖上进行多模态数据统一治理,覆盖 PDF、图像、音视频等非结构化数据。通过 Paimon、Iceberg、Hudi 等开放格式支持,实现全类型数据的元数据注册、权限控制与生命周期管理,为 AI 模型训练提供高质量、可追溯的数据底座。
,这一点在91视频中也有详细论述
sys.stdout.write(input)
// Changes to this file may cause incorrect behavior and will be lost if the code is regenerated.
Nature, Published online: 25 February 2026; doi:10.1038/s41586-026-10159-6