福利中心

小红花-Learn & Explore-博客

小红花-Learn & Explore-快讯

币圈-币圈-未来事件

小红花-Learn & Explore-聊天室

小红花-Learn & Explore-直播

小红花-Learn & Explore-动态

币圈

芝麻金融-更多-ETH2.0挖矿

芝麻金融-更多-法币理财

芝麻金融-更多-抵押借币

链上赚币

芝麻金融-理财-双币宝

芝麻金融-理财-定期理财(屯币)

芝麻金融-理财-结构性理财

芝麻金融-理财-理财宝

芝麻金融-更多-财富管理

芝麻金融-理财-余币宝

量化基金

GT挖矿

芝麻金融-更多（理财产品）

芝麻金融-理财（打新）

launchpool

launchpad

赚币-HODLer Airdrop

candy_drop

web3 Airdrop

BTC挖矿

VIP专享

大客户借贷

赚币

模拟交易

衍生品-期权

衍生品-交割合约

衍生品-永续合约

合约入门

合约活动

衍生品-统一账户

衍生品

交易-杠杆ETF

交易-杠杆交易

交易-闪兑

交易-现货交易

交易-创新交易

交易-交易工具

交易-交易类型

交易-合约跟单

交易-机器人广场

交易-盘前交易

Alpha

交易

行情

买币-gateCard

卖币

买币-快捷交易

买币

买币-paywith

法币定投

小红花-推广

新手指南

活动中心

小红花-Learn & Explore-学院

小红花-Exchange-最新公告

小红花-Exchange-帮助中心

gate商店

小红花-Promotions-邀请计划

小红花-promotions-代理商

储备金

vip服务

合作伙伴

小红花-Promotions-机构和VIP服务

Gate OTC

cextg小程序

机构-经纪商项目

web3

交易机器人(账户)

ByteDance telah bermitra dengan Universitas Zhejiang untuk meluncurkan Vista-LLaMA, model bahasa besar multimodal yang dirancang untuk pemahaman konten video dan mampu menghasilkan deskripsi video berkualitas tinggi. Melalui pemrosesan token visual dan verbal yang inovatif, Vista-LLaMA memecahkan masalah "halusinasi" dalam konten video.

Vista-LLaMA unggul dalam beberapa benchmark Q&A video terbuka, terutama dalam tes NExT-QA dan MSRVTT-QA. Ini mencapai tingkat akurasi 60,7% dalam tes NExT-QA zero-shot dan 60,5% dalam tes MSRVTT-QA, melampaui semua metode SOTA saat ini. Hasil ini menunjukkan efisiensi dan akurasi Vista-LLaMA dalam pemahaman konten video dan pembuatan deskripsi.

TOKEN

Token

Benchmark

Bit ByteDance telah bermitra dengan Universitas Zhejiang untuk meluncurkan Vista-LLaMA, model bahasa besar multimodal yang dirancang untuk pemahaman konten video dan mampu menghasilkan deskripsi video berkualitas tinggi. Melalui pemrosesan token visual dan verbal yang inovatif, Vista-LLaMA memecahkan masalah "halusinasi" dalam konten video.

Vista-LLaMA unggul dalam beberapa benchmark Q&A video terbuka, terutama dalam tes NExT-QA dan MSRVTT-QA. Ini mencapai tingkat akurasi 60,7% dalam tes NExT-QA zero-shot dan 60,5% dalam tes MSRVTT-QA, melampaui semua metode SOTA saat ini. Hasil ini menunjukkan efisiensi dan akurasi Vista-LLaMA dalam pemahaman konten video dan pembuatan deskripsi.


字节跳动与浙江大学合作推出了多模态大语言模型 Vista-LLaMA，该模型专为视频内容理解而设计，能够输出高质量视频描述。通过创新的视觉与语言 token 处理方式，Vista-LLaMA 解决了在视频内容中出现“幻觉”现象的问题。

Vista-LLaMA 在多个开放式视频问答基准测试中表现卓越，尤其在 NExT-QA 和 MSRVTT-QA 测试中取得了突破性成绩。其在零样本 NExT-QA 测试中实现了 60.7% 的准确率，在 MSRVTT-QA 测试中达到了 60.5% 的准确率，超过了目前所有的 SOTA 方法。这些结果证明了 Vista-LLaMA 在视频内容理解和描述生成方面的高效性和精准性。

巴比特讯 字节跳动与浙江大学合作推出了多模态大语言模型 Vista-LLaMA，该模型专为视频内容理解而设计，能够输出高质量视频描述。通过创新的视觉与语言 token 处理方式，Vista-LLaMA 解决了在视频内容中出现“幻觉”现象的问题。

Vista-LLaMA 在多个开放式视频问答基准测试中表现卓越，尤其在 NExT-QA 和 MSRVTT-QA 测试中取得了突破性成绩。其在零样本 NExT-QA 测试中实现了 60.7% 的准确率，在 MSRVTT-QA 测试中达到了 60.5% 的准确率，超过了目前所有的 SOTA 方法。这些结果证明了 Vista-LLaMA 在视频内容理解和描述生成方面的高效性和精准性。


字节跳动与浙大联合推多模态大语言模型 Vista-LLaMA，可解读视频内容

ByteDance dan Zhejiang University bersama-sama meluncurkan Vista-LLaMA, model bahasa besar multimodal yang dapat menafsirkan konten video