2024年过到现在已经入秋,大家注意身体,多穿层衣服防止换季引发的感冒哦。
今天给大家带来新的人工智能领域的前沿资讯,打起精神来,我们将用最地道的话语来为你讲解这些内容!
1. 新突破!GameNGen - 实时生成游戏画面的AI引擎
最近,谷歌和特拉维夫大学的研究人员发布了名为“GameNGen”的基于神经模型构建的AI游戏引擎,实现了在不依赖传统游戏引擎的情况下,实时模拟1993年经典第一人称射击游戏《Doom》的游戏画面。
该系统使用增强版的Stable Diffusion v1.4,通过扩散模型预测每一帧画面,在单个谷歌定制的张量处理单元(TPU)上运行,以每秒20帧的速度生成高质量的游戏画面。GameNGen展示了一种全新的游戏生成方式,显现了人工智能在实时复杂视频游戏模拟中的巨大潜力。
GameNGen的关键技术与实现
1. AI图像生成方面的技术细节
GameNGen使用的是一个叫Stable Diffusion 1.4的修改版本。Stable Diffusion是一种基于扩散过程的生成模型,通过逐步去噪的方式,从随机噪声图像生成高质量的目标图像。
在玩《Doom》的时候,每个游戏画面都是由GameNGen根据玩家之前的操作和当前的状态一步步预测出来的,可以根据玩家的指令(鼠标和键盘作为输入),来快速生成接下来会看到的游戏场景。
- 首先,让智能体玩游戏并收集交互数据;
- 其次,利用这些数据训练生成式模型,使其生成的游戏场景更加逼真。
他们先让一个强化学习代理(reinforcement learning agent)来玩《Doom》,记录这个代理的游戏过程,生成一个庞大的训练数据集。然后,他们用这些数据来训练Stable Diffusion模型,让它变得更聪明,进而让最终生成的图片或图像的质量更高。
为了减轻自回归偏差和样本质量下降的问题,开发人员采用了噪声增强机制。
2. 游戏画面的实时生成与稳定性方面
GameNGen在单个张量处理单元(TPU)上以每秒超过20帧的速度生成新的《Doom》游戏画面。不仅生成得快,还很逼真,生成的图像质量与原始游戏相当,并且在长时间的游戏过程中保持稳定性。
研究人员的测试表明,有时候,10名人工评审员都难以区分在某一段时间的游戏画面是《Doom》原生的,还是GameNGen生成的。
GameNGen技术需要面临的挑战
尽管GameNGen展示了巨大的潜力,但在使用Stable Diffusion也带来了一些图像故障问题。例如,在预测游戏帧时,有时候会出现一些奇怪的伪影(artifacts),影响了画面的细节,特别是游戏界面的底部显示区(HUD,Heads-Up Display)。
此外,保持图像的视觉清晰度和一致性也是一个挑战。如果GameNGen在生成连续场景时,有时候忘记衔接的细节,这就会让人觉得画面不连贯(画面前后出现不一致)。
GameNGen引擎展示了AI在实时视频游戏合成中的巨大潜力,显著减少了开发时间和成本,为小型工作室和个人创作者带来了新的可能。该引擎不仅能复制复杂互动环境中的标志性视觉效果,还具有广泛的应用前景,如虚拟现实、自动驾驶汽车和智能城市等领域。
尽管现代图形密集度更高的游戏仍需要更大的计算能力,且开发通用AI游戏引擎存在挑战,但这一技术突破预示着一个由AI驱动游戏创作和模拟的未来,展示了人类创造力与机器智能之间不断模糊的界限。
2. AI技术可以帮助医院全自动生成病历啦!
复旦大学附属眼耳鼻喉科医院(上海市五官科医院)最近推出了一项革命性的新技术——AI生成式病历系统,旨在大幅提升病历处理效率。这项系统专为“儿童屈光不正”领域设计,利用大量数据和人工智能技术,实现病历的自动化、智能化和准确编写,解决了医生在就诊高峰期间撰写病历耗时长、压力大的问题。
AI生成式病历系统对于医生的最大帮助就是彻底释放了医生撰写病历的时间,改善患者的就医体验和诊疗效率,医生在病历的相关方面只需要关注系统生成的报告是否有误即可,其他事情都无需医生关心。
AI生成式病历系统的技术特点
AI生成式病历系统将自然语言处理(NLP)、大模型(LLM)、语音识别(ASR)和深度学习等技术进行深度融合,从而实现其强大的功能。同时,专家们整合了眼视光学知识体系的内容和人工智能技术,建立了一个专业的眼视光术语库。
这个术语库就像一个庞大的知识宝库,里面包含了大量的病历信息、学科知识、文献资料和病种知识。模型通过这些数据进行深度学习,逐渐掌握了帮助医生解决相关问题的技能。
接着,医院的专业人员结合上海市的病历质控标准等内容,对模型的训练效果进行评价与微调,成功模拟了眼科医学专家的诊疗流程和思维逻辑。
该系统的功能与具体应用
自动生成病历:该系统能够准确理解和处理专业医学术语,然后生成符合专业要求的高质量病历报告或电子文档。
简化医生的处理流程:医生只需专注与患者沟通与问诊,系统后台会对医生和患者的沟通内容进行深度理解与总结,最终生成病历,大大简化医生手写病历的过程。
提高效率和患者满意度:由于医生可以将更多的时间和精力用于与患者的深度沟通,患者对自己的病情会有更深入的了解,也会对医生的专业程度感到更高的信任。这样不仅提高了诊疗效率,也提升了患者的满意度。
AI生成式病历系统需要注意的可能存在的问题
在实现这个理想功能之前,要考虑到多个设备之间的交互,比如:医生与患者谈话时的录音是否清晰、语音转文字的过程是否足够准确、医生和患者的口音要如何解决、分析文字内容的大模型系统是否要不断优化、最终生成的电子病历是否符合要求与标准等等。
只有解决了包括但不限于这些问题之后,AI生成式病历系统才能够真正的被普及到各个医院,让老百姓和医生的看病效率越来越高。
https://mp.weixin.qq.com/s/cquG1d6q5WDgMtBgzmklpA
http://www.itbear.com.cn/html/2024-09/505406.html
https://www.sohu.com/a/808144490_362225
https://www.xinfinite.net/t/topic/5388
https://www.sohu.com/a/805504495_121312630
https://weeklygeek.net/tech/new-ai-model-can-hallucinate-a-game-of-1993s-doom-in-real-time/
https://gamengen.github.io/