(資料圖片)
近日,海天瑞聲CEO王曉東受邀出席2023年中關村論壇,并發表了題為《共享開放數據助力數字中國建設》的演講,宣布海天瑞聲將開放多模態數據集。
王曉東表示,作為AI數據行業里首家上市公司,海天瑞聲天然肩負著開源開放、推進數據資源整合共享的社會責任。開源數據集可以幫助各領域的研究者和開發者快速獲得更多高質數據樣本,進而提高模型的精準度和魯棒性,幫助他們更好地進行算法研究和模型訓練。此次即將開源的多模態數據集「DOTS-MM-0526」涵蓋圖像、語音、文本等多個維度。海天瑞聲希冀與全球AI開發者和研究人員建立更加緊密的合作關系,共同推動人工智能技術的發展和應用。同時,開源數據集計劃亦是公司對于AI開放生態的一次有益嘗試,是公司在數據智能化應用領域持續發力的體現。
會上,王曉東還發布了海天瑞聲企業品牌煥新戰略:公司將啟用全新Logo,英文名稱將從“SpeechOcean”改成“DataOcean AI”,中文名“海天瑞聲”不變。
王曉東表示,“此次品牌升級不僅是一個簡單的改名,它還代表著海天瑞聲將在數據科技和人工智能領域的進一步發展和探索。”
他進一步闡述道,海天瑞聲因優質海量的智能語音數據被大家所熟知,但近些年來隨著人工智能技術的不斷迭代與發展,海天瑞聲的業務已從單純的語音領域服務,擴展至提供覆蓋語音、計算機視覺、自然語言處理和多模態的數據解決方案及成品數據集,未來還將支持以數據驅動的生成式AI業務發展。顯然海天瑞聲早已不再局限于“語音Speech”而是更廣闊的“數據Data”海洋。為更好地反映公司的業務范圍和技術實力,海天瑞聲對企業品牌進行了升級,以更好地滿足客戶全方位需求。
而品牌升級背后,海天瑞聲全新的戰略布局也逐漸清晰呈現。據了解,自2005年成立以來,海天瑞聲就一直在為AI產業鏈上的各類機構提供AI算法模型開發訓練所需的專業數據集。目前這些數據集已覆蓋智能語音、計算機視覺、自然語言等AI核心領域,并在自動駕駛、虛擬主播、聲紋識別、人臉姿態等眾多人工智能場景及相關算法模型的訓練過程中獲得應用。