发布时间:2023-06-07 17:38 原文链接: 人工智能研究是不是走错了方向

最近,以AIGC中GPT为代表的AI,总是使用大数据或大模型,惹得不少人私下不断犯嘀咕:人工智能研究是不是走错了方向?!对于这个问题,有人认为人工智能的研究方向并没有走错,而是在不断地扩展和深化。大数据和大模型是人工智能研究中的重要组成部分,它们可以帮助我们处理更加复杂的数据和问题,提高人工智能的精度和性能。但是,我们也需要注意到人工智能不仅仅是基于数据的模型,还包括了许多其他方面的研究,比如符号推理、逻辑推理、(非)知识表示、诡诈欺骗、真假辨识等等。我们需要在不同方向上进行研究,以便更好地发掘人工智能的潜力,为社会带来更多的福利而不是更多的问题。

不少人机环境系统智能中更多的是小数据简单算法弱算力,而不是大数据复杂算法强算力。这说明了数据量并不是解决问题的唯一关键因素,数据的质量和可靠性同样重要,在某些情况下,小数据集可能更加准确和可靠,因为它们更容易进行有效的数据清洗和筛选;对于某些任务而言,简单的算法就已经足够了,而且在性能和可解释性方面具有优势,复杂的算法可能需要更多的计算资源和更长的训练时间,并且可能产生过拟合等问题;弱算力的系统可以通过使用高效的算法和优化技术来提高性能,如可以使用并行计算、分布式计算和硬件加速等技术来提高系统的效率和性能,而不一定非得使用多少块A100、H100。

在人类学习中,权重是指模型中各个特征的重要性,小数据学习是指在数据集较小的情况下进行机器学习。权重的随机应变是指在小数据学习中,由于数据量少,模型容易出现过拟合的情况,因此在训练过程中引入随机性,使得模型能够更好地适应新数据。有人认为,在小数据学习中,权重的随机应变是一种有效的防止过拟合的方法。通过引入随机性,可以使得模型更具有泛化能力,从而能够更好地适应新数据。同时,权重的随机应变也可以帮助模型避免陷入局部最优解,从而提高模型的准确性和稳定性。但是,在实际应用中,权重的随机应变也需要根据具体情况进行调整,避免过度随机化导致模型效果下降。

小数据学习路线,前期效果比不过大模型大数据计算,但到了后期可能会更加强大。 在讨论机器学习中的两种不同的方法:小数据学习和大数据学习。小数据学习是指使用较小的数据集进行训练和学习,而大数据学习则是利用大量的数据来训练和学习模型。在前期,大数据学习往往能够取得比小数据学习更好的效果,这是因为大数据学习可以利用更多的数据来训练模型,从而提升模型的准确性和泛化能力。然而,随着时间的推移,小数据学习的优势也开始显现出来。在后期,随着数据集的增加和模型的优化,小数据学习可以取得更好的效果。这是因为小数据学习更侧重于深入理解数据和模型,而不是简单地利用大量的数据来训练模型。通过精细调整和优化模型架构、特征工程等方面,小数据学习可以取得更好的效果。

在小数据集中,我们不能仅仅依赖于大规模数据集中的机器学习算法和深度学习模型,而是需要更加注重数据的质量和特征,同时结合领域知识和人类的经验,来优化模型的性能。当面对小规模数据时,权重的设定和拓扑结构的选择非常重要。权重的恰当泛化能够帮助我们在小数据集中发现有用的模式,并且在未来的预测中得到更好的结果。而拓扑结构的选择则能够帮助我们更好地理解大小数据之间的关系,从而更好地进行决策。

客观地说,信息不但有数量而且还有质量,信息的至少包括数量和质量两个方面。传统意义上,我们通常更注重信息的数量,认为获取越多的信息越好。但是,信息的质量也非常重要,因为低质量的信息可能会误导我们的判断,影响我们的决策。为了更好地应对信息时代的挑战,我们需要更多地关注信息的质量。这包括了信息的来源、真实性、准确性、完整性、可信度等方面。我们需要学会辨别虚假信息、谣言和误导性信息,以便做出正确的判断和决策。同时,我们也需要注意信息的多样性和多方面性。信息的质量不仅仅包括了信息的正确性和可靠性,还包括了信息的广度和深度。我们需要关注多个来源的信息,以便获取多方面的不同观点和意见。只有当我们获得了足够的多样性和多方面性的信息,我们才能做出更加客观和全面的判断和决策。

信息质量的好坏往往与信息的接受者有关。因为不同的人有不同的背景、知识水平、思想倾向等,对同一份信息的理解和判断也会有所不同。例如,对于一份科技类新闻文章,对于了解科技领域的人来说,可能会更容易理解和判断信息的真实性和可靠性;而对于不太了解科技领域的人来说,可能会更容易受到一些夸大和误导的信息影响,从而导致对信息质量的评价有偏差。所以,在评价信息质量的时候,需要考虑到不同人的接受能力和认知水平,尽可能地提供更加客观、准确、全面的信息,同时也需要教育和引导公众提高信息素养,以便更加理性和客观地接受和评价信息。评价信息质量需要考虑多个方面,需要综合考虑真实性、完整性、可靠性、时效性、公正性这些方面的因素,才能得到更加准确和全面的评价。

在人机环境系统的控制中,除了有机器客观事实性的反馈之外,还有人类主观价值性的反馈。这同时也深刻地表达了人机交互系统的特点和挑战。在人机交互中,机器可以提供客观的数据和反馈,但是人类用户的主观感受和价值观也是非常重要的。例如,在智能家居系统中,机器可以自动控制温度和照明等设备,但是用户的舒适感受和个人喜好也需要被考虑进去。因此,在设计人机交互系统时,需要考虑到用户的主观需求和价值观,并且让机器能够理解和适应这些需求和价值观。这需要涉及到人机交互的多个方面,包括用户体验设计、人工智能算法和数据分析等。一般而言,在人机环境系统中,除了机器的形式化结构之外,还有人类的非数学结构存在,即使我们使用计算机技术和算法来处理信息,人的主观性、情感和判断力也是非常重要的。因此,在设计人机交互系统时,我们需要考虑人的特征,以便系统可以更好地服务于人类需求。这个观点也提醒我们,不要过度依赖机器和算法,而需要在人机交互中找到平衡点,才能实现最佳的用户体验和性能。

在实践过程中,许多人的经验和体验很难转化为数据,这些经验和体验都是非常主观的,难以用量化的方式来表达和衡量。比如,一个人的情感体验、社交经验、文化背景等等,都是非常独特而个性化的,很难用数据来简单地表示。然而,我们也不能因为困难就放弃了解和分析这些经验和体验。我们可以采用一些定性研究的方法,如深度访谈、案例研究等,来了解人们的个体经验和体验。同时,我们也可以通过特征数据分析,挖掘出一些隐藏在数据背后的趋势和规律,从而更好地理解人们的行为和感受。

在人机环境系统中,协同可以促进人与机器之间的交互,从而提高系统整体的性能和效率。如在工业生产中,机器可以处理大量的重复性工作,而人类可以处理需要判断和决策的任务,二者的协同可以提高生产效率。然而,协同也可能带来一些消极的影响,人类若过度依赖机器可能导致人类知识和技能的退化,机器出现故障可能会使整个系统瘫痪。因此,在设计人机环境系统时,需要仔细权衡协同的积极作用和消极作用,以实现最佳的用户体验和性能。同时,也需要注意提高人类的技能和知识水平,以便更好地应对机器故障等突发情况。

人类学习是通过感官体验和实践经验获得的,而机器学习则依赖于规则和概率推断。人类的学习过程是非常复杂和多样化的,因为人类能够利用自己的经验和感知来理解和适应各种不同的环境和情形。相比之下,机器学习需要在事先设定的规则和概率分布下进行操作,因此机器学习的应用范围和效率受到规则和概率模型的限制。然而,这种区分并不是绝对的。在某些情况下,机器学习也可以通过模仿人类学习的方式来提高自己的表现,例如使用深度学习模型来模拟人类视觉系统的工作原理。另外,人类的学习也可以受到规则和概率的影响,例如在学习语言时,人类也需要遵循一定的语法规则和语言模型。因此,我们需要更加深入地研究人类和机器学习的本质和相互作用,以便更好地应用它们来解决实际问题。

现在,或许是该对AI的研究方向做点什么的时候了......


相关文章

AI生成?史上最短命论文,发表后仅三天被撤稿

2024年2月13日,西安交通大学郝定均作为通讯作者在FrontiersinCellandDevelopmentalBiology在线发表题为”Cellularfunctionsofspermatog......

AI时代|国资委要求央企加快布局发展人工智能产业

国务院国资委2月21日消息,“AI赋能产业焕新”中央企业人工智能专题推进会近日召开。国务院国资委党委书记、主任张玉卓提出,推动中央企业在人工智能领域实现更好发展、发挥更大作用。会议明确,中央企业要把发......

北京多举措,加快构筑人工智能创新策源地

2023年以来,北京市陆续出台人工智能创新策源地实施方案、通用人工智能若干措施等政策,建立并稳步推进市级人工智能专班工作机制,统筹产业发展,推动产业集聚,构建完整产业链条。人才资源国内领先在顶尖人才方......

通知|征集第三批“北京市通用人工智能产业创新伙伴计划”成员

为加快大模型应用落地,持续推动典型应用的商业化、规模化推广,在总结评估第一批和第二批伙伴计划工作经验的基础上,现组织开展第三批“伙伴计划”成员征集工作,聚焦“高质量数据供给、高性能算力提供、高价值模型......

到2033年,临床试验市场中的人工智能将以复合年增长率28%增长

2023年,全球人工智能临床试验市场规模为16亿美元,预计到2033年将达到188.2亿美元左右,2024年至2033年复合年增长率为28%。市场概况人工智能(AI)是当今药物开发领域最具革命性的技术......

Clarivate呼吁释放人工智能和机器学习在生命科学中的潜力

在OpenAI的GPT-4于一年多前首次亮相后,人工智能(AI)和机器学习(ML)持续引起广泛关注。Clarivate认为这些技术在生命科学领域有着巨大的潜力,将深刻改变药物开发和医学领域。在一场题为......

北京:“助航”潜在硬科技独角兽企业政策宣讲暨对接交流会举办

2月1日,北京市科委、中关村管委会中关村高科技产业促进中心(以下简称“高促中心”)会同创新创业服务处、中关村独角兽企业发展联盟组织潜在硬科技独角兽企业政策宣讲暨对接交流会。来自人工智能、新一代信息技术......

多部门联合开展全国数据资源调查

国家数据局19日发布消息,为摸清数据资源底数,加快数据资源开发利用,更好发挥数据要素价值,国家数据局、中央网信办等部门联合开展全国数据资源情况调查,调研各单位数据资源生产存储、流通交易、开发利用、安全......

张平文院士:数智赋能造就拔尖创新人才

2023年9月,第五届中国研究生人工智能创新大赛全国总决赛举行。武汉大学获得一等奖2项、二等奖4项、三等奖7项。图为该校参赛团队留影。(武汉大学供图)当前,世界百年未有之大变局加速演进,数字技术带来的......

这项“试”了六年的研究,让农田施肥更环保

2018年,当团队成员徐鹏提出计算全球农田施肥氨排放的想法时,数据和计算方法的巨大挑战横亘眼前,郑一的内心并无太大把握。“先迈第一步,否则没有任何希望!”郑一抱着试一试的想法,带领团队从繁琐的数据收集......