DeepMind 又整了个大活:PaliGemma 2,到底有多强?
1FGJ博客 发布于 2025-08-14
说实话,谷歌这几年在AI领域的节奏是真的快,尤其是 DeepMind,几乎每次出新模型都能带来点“新味儿”。这次他们升级了视觉语言模型(VLM),搞出了个叫 PaliGemma 2 的玩意儿,一看名字你可能以为是上个版本的小打小闹——但其实,这一代变化不小,尤其是在多模态任务上的...
FGJ博客 发布于 2025-08-14
说实话,谷歌这几年在AI领域的节奏是真的快,尤其是 DeepMind,几乎每次出新模型都能带来点“新味儿”。这次他们升级了视觉语言模型(VLM),搞出了个叫 PaliGemma 2 的玩意儿,一看名字你可能以为是上个版本的小打小闹——但其实,这一代变化不小,尤其是在多模态任务上的...
FGJ博客 发布于 2025-08-14
说实话,第一次接触到 VisoMaster 这款换脸工具的时候,我是有点被“震”到的。不是那种科技炫技的震撼,而是那种“哇,这玩意儿已经做到这种程度了?”的惊讶。咱们今天就唠唠这个看起来像科幻电影里的玩意儿,其实已经悄悄走进现实的 AI 换脸工具。 VisoMaster项目仓库:...
FGJ博客 发布于 2025-08-14
Looka是一个在线AI设计工具,专注于生成Logo。它通过人工智能和机器学习算法帮助用户,特别是企业和个人,创建个性化的Logo。使用Looka,不需要任何设计经验,用户可以从丰富的设计模板中选择,并通过定制颜色、字体和图标,打造出精美的Logo。Looka的算法会根据用户输入...
FGJ博客 发布于 2025-06-03
Playwright MCP是微软推出的一款创新的浏览器自动化工具,它基于Model Context Protocol (MCP)协议开发。这一工具通过Playwright的可访问性树实现与网页的高效交互,摆脱了对传统视觉模型或截图的依赖,特别适合与大语言模型(LLM)配合使用。...
FGJ博客 发布于 2025-05-29
Jules是Google Labs推出的的AI是编程智能体,旨在借助自动化技术为广大开发者提供更高效的编程体验。它不仅能够自动生成代码,还能有效分解复杂任务,逐步实现解决方案。Jules的出现,相信会在软件开发领域带来不小的影响,特别是在代码质量和效率方面。 Jules官网地址:...
FGJ博客 发布于 2025-05-26
谷歌近期推出的Flow是一款整合多项前沿AI技术的电影制作工具,主要为影视创作者提供智能化的工作流程。该平台融合了Veo 3、Imagen 4和Gemini 2.5三大核心AI模型,能够根据用户输入的文本提示自动生成具有连贯性的电影场景或短片,显著降低了专业影视制作的技术门槛。 ...
FGJ博客 发布于 2025-05-26
Day of AI是一个由麻省理工学院(MIT)推出的免费AI学习平台,专为小学至高中学生设计。平台提供丰富的学习资源,包括基础知识、实践活动和专业发展培训,旨在培养学生的AI素养。课程内容根据年龄分为三个层次,小学生、初中生和高中生分别从AI的基础概念到实际应用、再到深入的编程...
FGJ博客 发布于 2025-05-26
Coursera作为全球著名的在线教育平台,汇聚了众多与AI(人工智能)相关的高质量课程。它与世界顶尖的大学和研究机构合作,帮助全球学习者掌握最前沿的人工智能技术。 Coursera官网:https://www.coursera.org/ 在Coursera上,学习者可以选择从基...
FGJ博客 发布于 2025-05-03
Grok是由xAI公司开发的大型语言模型(LLM),其最新版本Grok 3于2025年2月17日发布,为用户提供了多个模型选择,包括Grok 3、Grok 3 mini,以及推理模型Grok 3 Reasoning Beta、Grok 3 mini Reasoning。这些模型可...
FGJ博客 发布于 2025-04-19
Copilot(Microsoft 365 Copilot)是结合了大型语言模型(LLM)和Microsoft Graph的人工智能助手,帮助用户将自然语言输入转化为实用的生产力工具。它现已集成到众多微软应用程序中,比如Word、Excel、PowerPoint、Outlook和...