印度首家IT公司推出“印度版ChatGPT” 支持40种印度方言
文章概要:
1. Tech Mahindra推出面向印度语言的开源语言模型Project Indus,这可能是该公司迄今最重要的项目。
2. 该模型最初将支持40种印地语言方言,参数规模预计达到70亿。模型有望为印度25%的人口提供服务。
3. 为不同语言和方言收集数据仍然是最大的挑战。Tech Mahindra正在通过语言捐献渠道收集数据集,并与各利益相关方合作。
最近,印度IT公司Tech Mahindra宣布推出了一个面向印度语言的开源基础语言模型“Project Indus”。该项目可能会成为该公司迄今为止最重要的项目。目前,像OpenAI的GPT模型这样的大型语言模型,尽管具有多语言能力,但在理解和生成印度语言内容方面受到英语数据集的限制。

图源备注:图片由AI生成,图片授权服务商Midjourney
Tech Mahindra首席执行官古尔纳尼表示,该模型将是最大的印度语言模型,可能为全球25%的人口提供服务。 Tech Mahindra尚未透露项目成本或预计发布时间,但目标是首先构建一个70亿参数的语言模型。
该模型最初将支持40种不同的印地语言方言,后续将逐步添加更多语言和方言。他们表示,尽管目前一些印度语言模型Bhashini和AI4Bharat等已经存在,但仍需开发一个基础模型。他们的接口可能具有语音和文本信息,但尚未考虑加入类似ChatGPT的聊天界面。
Tech Mahindra的首要目标是首先创建一个用于文本继续的语言模型,然后提供对话功能。一旦模型的性能和方言生成效果明确,他们将在开源中发布。
印地语言模型可以优先考虑文化敏感性,确保生成内容尊重当地习俗和规范。它还可以使AI普及,为该国更广泛的非英语使用者提供服务。
然而,采集不同语言和方言的数据仍然是Tech Mahindra面临的最大挑战。为此,该公司正在寻求不同方言使用者的贡献,以帮助构建数据集。他们已开设了一个门户网站,以获取印度人的语言捐献。
人工智能专家是自由职业市场的热门新职位:生成式 AI 相关职位数量增加近 250%
站长之家(ChinaZ.com)9月11日消息:VladHu曾作为一名软件工程师开始自己的职业生涯,最终创立了自己的软件公司,但在过去的一年里,最大的工作机会是自由职业的人工智能专家项目。站长网2023-09-11 10:09:540001大厂混战大模型:四大流派,没有赢家
今年以来,整个科技圈最热闹的事情,是发布大模型。从3月百度率先发布文心一言以来,阿里、科大讯飞、360、腾讯纷纷跟上。7月,华为、京东、携程也召开发布会,虽迟但到。科技公司又卷起来了。以至于某头部互联网大厂的技术负责人,在一场发布会开场就强调:“今天不会发布预训练多模态大模型,今天也不会蹭大模型的热点。”站长网2023-07-25 12:20:410000加州法律明确对AI聊天机器人的监管
当下,各国正加强对AI的监管,以及相关法规的完善。据外媒报道,美国加州《商业和职业法》对“机器人”进行了规范,其中第17940节定义了术语“机器人”、“在线”、“在线平台”和“人”。第17941条规定,任何人使用机器人与加利福尼亚州的另一人进行在线通信或互动,意图误导他人是人类身份,并故意通信内容上欺骗他人,以达到在商业交易中购买或销售商品或服务,或影响选举中的投票,都是非法的。站长网2023-06-12 17:53:260000小步快跑,淘宝进入全面化内容时代
淘宝再次改版,其最新的具体动作是上线了“夜淘宝”入口。用户在淘宝首页右上角点击进入,即可一键来到一个像街区般的夜生活淘宝。今年,阿里出现在媒体上的次数变多了,“变化”是紧随出现的高频词。而“拥抱变化”,是集团内部的共识。据媒体报道,今年初淘天集团对内宣布了五大战略,分别是直播、私域、内容化、本地零售和价格力,这在内部被称为“五大战役”。站长网2023-08-16 17:10:080000科大讯飞刘庆峰:讯飞星火大模型10月实现中文超越ChatGPT
据媒体报道,在第七届世界智能大会上,科大讯飞董事长刘庆峰在现场演讲中表示,认知大模型已经成为通用人工智能的曙光,目前纯大模型仍存在缺陷,包括无法及时更新知识、事实类问答容易“张冠李戴”、对传统典籍容易出现编造情节等。刘庆峰还表示,现在讯飞星火离ChatGPT只有一步之遥,与100分相比只差两分,在今年10月份之前就会超越它。站长网2023-05-18 16:05:260002