分布式框架Ray之:Ray Datasets 按列读取

评论(0)

需求描述 需要支持分布式数据读取对单个特征所有数据进行分析,如特征选择、分箱等适应分布式,最小化读取中内存增加 数据格式: CSV 文件,内容为mnist数据集 28*28 转为784个特征, 表头为:label + 784个特征 ...