哈佛大学等Nature Communications重磅发文:机器学习预测食品加工程度

2023/7/24 10:13:41

 

尽管越来越多的证据表明超加工食品消费量的增加会对健康产生不良影响,但目前很难确定什么是加工食品。事实上,目前以加工为基础的食品分类范围有限,无法区分加工程度,这阻碍了消费者的选择,并减缓了加工食品对健康影响研究的进展。本研究介绍了一种可以准确预测任何食品的加工程度的机器学习算法,表明在美国食品供应中超过73%的是超加工食品。研究发现个体饮食中高度依赖超加工食品与代谢综合征、糖尿病、心绞痛、血压升高和生物学年龄等健康问题的风险增加相关,还会降低维生素的生物利用度。将食品替换为加工较少的替代品可以显著减少超加工食品的健康影响,这表明提供目前消费者无法获取的加工程度信息可能有助于改善人群健康。

 

研究亮点

 

1. FoodProX是一种机器学习工具,可以预测食品的加工水平。

2. 该工具利用了来自美国农业部食品和营养数据库的营养信息。

3. 人工智能工具证实,美国食品系统中超过73%的是超加工食品。

 

图1 FoodProX分类器和FPro评分之间联系的示意图概述。

 

图2 食品加工和营养变化(FoodProX)。100 g炒洋葱(a)和洋葱圈(b)与生洋葱相比的营养物质浓度比值,表明加工如何改变多种营养物质的浓度。使用训练的随机森林分类器(FoodProX)对100 g每种食物(c、d)中的营养物质浓度进行分类,并要求其根据NOVA预测其加工水平。

  

图3 NOVA分类和加工评分。NOVA手动分类(a)和随机森林分类(b)分别对FNDDS 2009-2010中列出的34.25%的食品和所有食品分配唯一标签并通过对概率进行主成分分析可视化FOODProX的决策空间。对于每个食物k,加工评分FProk表示概率向量在直线p1 + p4 = 1 (深红色)上的正交投影。(c)根据FPro对FNDDS 2009/2010所有食品进行排名,洋葱产品按加工程度递增排序,从“生洋葱”,到“冷冻洋葱圈”。(d)2015-2016年《我们在美国吃什么》(WWEIA)中155种食品类别的FPro分布。

 

 

图4 健康影响和食品替代。对20047名NHANES(1999-2006)中有饮食记录的18岁以上的个体计算了个体饮食处理得分iFProWC,其中A和B报告的每日独特菜肴(a)数量相当,每日热量摄入(b)相似,但在iFProWC(c)中表现出显著差异。(d)计算各种表型与iFProWC的相关性。(e)当一个(橙色)或十个(黄色)菜肴被替换为加工程度较低的替代品时iFProWC的变化。(f)替代不同数量的菜肴对代谢综合征几率、维生素B12、维生素C和双酚A浓度的影响,表明最小替代策略可以显著改变超加工食品的健康影响。

 

总结

 

该研究构建了一个CSA-NN,用于在没有先验知识和复杂操作的情况下识别家用冰箱中的常见病原体。CSA由16个由琼脂凝胶支撑的染色点组成,具有良好的防潮性和抗冻性,有效地提高了其在冷藏环境中的实用性。此外,通过建立的数据库训练了一个具有背景校正能力的神经网络,并建立了准确的颜色模式病原体关联。最后,在复杂的冷藏环境中,CSA-NN实现了蛋壳上金黄色葡萄球菌和单核葡萄球菌的准确鉴定(83%的准确率)。CSA预计将扩展到其他需要病原体识别的领域,以有效预防和应对病原体引起的食品安全事件。

 

该研究开发了一种机器学习分类器FoodProX,以营养物质测量为输入,并以可复制、可移植和可扩展的方式训练来预测任何食品的加工程度。该分类器具有从营养信息中复制手工NOVA分类的显著能力,证实了NOVA分类导致不同的营养变化模式,并通过机器学习准确地检测到。连续加工评分FPro以非线性方式将从NOVA手动标签中学习到的加工技术特征与食品成分数据中的营养成分浓度相结合,可以捕捉任何食物的加工程度,并帮助量化个体的整体饮食质量,最终揭示表征个体饮食的加工程度与多种疾病表型之间的统计相关性。将FPro与流行病学研究和食品分类相结合,可以形成一个自动化和实用的管道,能够系统地改善人群饮食和个人健康。此外,所有食品中添加剂和加工副产品的化学浓度的系统添加将使FPro的构建完全无监督,独立于任何人工分类。更广泛的化学类别也将能够更好地模拟“食物基质效应”,捕捉植物和肌肉组织细胞基质中加工和烹饪诱导的转化。

 

来源 | 食品放大镜