恭喜你成为UI中国推荐设计师 (详情)
//百度统计 20220402 uicn

您的意见是我们 UI 中国进步的动力!
点击立即反馈按钮,发表您的意见!
立即反馈
QQ群反馈
您也可以加入UI中国官方反馈群进行反馈!
群号:302892100
备注:反馈问题后@管理员能让我们及时了解您的意见

提交需求

赛事与广告咨询合作,请填写需求表单,我们会在第一时间与您联系!

0/20
0/200

设计大赛

  • 设计大赛
  • 发布广告
  • 发布招聘
  • 其它需求

提交完成
感谢您对UI中国的支持和信赖!
你知道什么是AI的数据设计吗 优漫动游
0.0°
2023-10-08 好文转载 经验/观点 原作者: 广州平面设计培训 举报 105 0 0 0

在人工智能领域,数据是推动AI技术发展的基础。而AI模型的性能和公平性取决于数据的质量和代表性。

  在人工智能领域,数据是推动AI技术发展的基础。而AI模型的性能和公平性取决于数据的质量和代表性。因此,在设计AI模型时,数据设计是至关重要的一环。它涉及到各种问题,例如如何选择数据、如何标注数据、如何收集数据以及如何评估数据的质量。  

你知道什么是AI的数据设计吗  

  在人工智能应用程序的开发过程中,设计数据是开发AI模型的第一步。这个过程通常是一个迭代的过程,需要使用试验数据来开发初始的AI模型,并通过收集额外数据来修补模型的局限性。关键标准是确保数据适用于任务,并且覆盖足够的范围来代表模型可能遇到的不同我们和场景。  

  然而,目前用于开发AI的数据集通常覆盖范围有限或者具有偏差。这会对AI模型的性能产生负面影响,因为不同人群和场景的数据缺乏代表性。为了提高数据覆盖率,让更广泛的社区参与数据的创建是一种方法。目前最大的公共数据集CommonVoice项目就是一个例子,该项目包含了来自166,000多名参与者的76种语言的11,192小时语音转录。  

  当现实世界中的代表性数据难以获得时,合成数据可以被用来填补覆盖空白。例如,在医疗保健领域,可以共享合成医疗记录来促进知识发现,而无需披露实际的患者信息。在机器人技术中,真实世界的挑战是终极的测试平台,也可以用高保真模拟环境来让智能体在复杂和长期任务中实现更快、更安全的学习。  

  然而,合成数据也存在一些问题。由于合成数据与现实数据之间总是存在差距,因此将基于合成数据训练的AI模型转移到现实世界时通常会出现性能下降。如果模拟器的设计不考虑少数群体,那么合成数据也会加剧数据差异。因此,在标准化和透明的报告中记录数据设计地上下文就非常重要。  

  为了更好地理解数据的质量和相关信息,研究人员已经开始创建各种「数据营养标签」(datanutritionlabels)来捕获有关数据设计和注释过程的元数据(metadata)。这些元数据包括数据集中参与者的性别、年龄、种族和地理位置的统计数据,这有助于发现是否有代表性不足的亚群未被覆盖。数据来源也是一种元数据,它跟踪数据的来源和时间以及产生数据的过程和方法。  

  元数据可以保存在一个专门的数据设计文档里,数据文档对于观察数据的生命周期和社会技术背景来说非常重要。文档可以上传到稳定且集中的数据存储库(例如Zenodo)中。这些元数据标签和文档可以帮助研究人员、政策制定者和公众更好地理解数据,以及评估AI模型的性能和公平性。  

  在未来,随着技术和数据资源的不断发展,我们相信数据设计的过程会越来越透明和标准化。这将有助于确保数据的质量和代表性,并为开发高效、高效、平等的AI模型提供坚实的基础。  

  

Powered by Froala Editor

更新:2023-10-08

收藏

0人已收藏

系咁噶

大哥好

  • 213

    作品

  • 1

    粉丝

  • 0

    关注

  • 设计师都在看的全球设计网站,你居然还不知道!优漫教育
  • 9种格式基础知识优漫教育
  • 为什么有人说UI就业不好该如何掌握高端技能优漫教育
  •    学做‘视频剪辑’攻略优漫教育

    猜你喜欢

      2023-10-08 好文转载 经验/观点 原作者: 广州平面设计培训 举报 105 0 0 0

      你知道什么是AI的数据设计吗 优漫动游

      0.0°

      你确定要举报你知道什么是AI的数据设计吗 优漫动游

      如果查出恶意举报,十天内禁止提交任何举报申请。

      0/200

      上传证据: 超过10M的附件请使用网盘地址

      点击上传附件

      对谁可见:

      全部设计师
      • 全部设计师
      • 推荐设计师和认证设计师

      您确认要推荐?

      该作品发布时间:2023年10月08日

      评分

      完整度

      启发性

      勤奋性

      排版布局

      推荐心得

      建议20-200字以内

      0/200

      0
      0
      0

      账号或密码错误,请重新输入

      账号或密码错误,请重新输入

      登录

      手机号

      发送验证码 120s 验证码错误

      登录
      第三方账号登录