首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

#量化

Trio-ViT | 专门针对高效 ViTs 的卷积 Transformer混合架构的加速器!

集智书童公众号

感谢自注意力机制强大的全局信息提取能力,Transformers在各种自然语言处理(NLP)任务中取得了巨大成功。这一成功催生了视觉Transformers(V...

3210

NVIDIA发布TensorRT Model Optimizer:让模型飞起来!

GPUS Lady

苏州吉浦迅科技有限公司 · 联合创始人 (已认证)

Model Optimizer主要针对PyTorch和ONNX模型,生成模拟量化检查点。这些检查点可以轻松地部署到其他推理库,如TensorRT-LLM或Ten...

3810

【Quant102】 经典技术指标 Pandas 实现(第一部分)

ApacheCN_飞龙

7210

使用Python轻松获取股票实时数据

用户11122129

近年来,股市并未迎来大牛市,相反,我们正面临着一个熊市,行情相当不佳。尽管股市一在3000点的心理阻力,左右徘徊,但随后又出现了下跌的趋势,让投资者备受挑战。

12610

Flash Attention稳定吗?Meta、哈佛发现其模型权重偏差呈现数量级波动

机器之心

数值偏差是造成这种训练不稳定性的潜在原因,由于大语言模型训练运行成本极高,如何量化数值偏差俨然成为关键问题。

10810

微调和量化竟会增加越狱风险!Mistral、Llama等无一幸免

新智元

实验中的量化模型使用GPT生成的统一格式(GGUF)进行量化,下面的结果表明,模型的量化会使其容易受到漏洞的影响。

15210

ICLR被曝巨大黑幕,评审和作者竟私下勾结?49.9%论文疑有AI审稿

新智元

这篇论文探究了当今顶会的审稿现状,通过控制变量的方法追踪并量化了因果关系,进而揭示了AI辅助评审对论文接收结果可能产生的影响。

10010

86岁「最会赚钱的数学家」Jim Simons去世,量化投资一代传奇落幕!

新智元

当地时间5月10日,数学和量化交易领域的传奇人物Jim Simons在纽约市曼哈顿的家中去世,享年86岁。

7110

字节开源大模型量化新思路,2-bit量化模型精度齐平fp16

机器之心

随着深度学习大语言模型的越来越火爆,大语言模型越做越大,使得其推理成本也水涨船高。模型量化,成为一个热门的研究课题。

13710

多模态产品在智能文档处理应用的展望------以TextIn模型为例

洁洁

? ?第十四届视觉与学习青年学者研讨会(VALSE 2024)于5月5日-7日在山城重庆渝北区悦来国际会议中心举办。大会聚焦计算机视觉、模式识别、多媒体和机器学...

13110

AffineQuant: 大语言模型的仿射变换量化

BBuf

本文研究了大型语言模型(LLMs)在移动和边缘设备上的推理加速问题,这一问题在现实应用中具有重要意义。随着大型语言模型在多种任务中展现出卓越的性能,它们吸引了越...

13510

【RAG论文】RAG中半结构化数据的解析和向量化方法

致Great

这篇论文提出了一种新方法,用于解析和向量化半结构化数据,以增强大型语言模型(LLMs)中的检索增强生成(RAG)功能。但是读下来感觉并不是很“新”,基本是常见文...

12510

AAAI 2023 | 探索使用 CLIP 来评估图像的外观和感觉

用户1324186

上海交通大学 · 研究员 (已认证)

外观和感觉是人类解释图像时的两个影响因素,而对这两个元素的理解一直是计算机视觉中长期存在的问题。图像的外观通常与直接影响内容的可量化属性相关,例如曝光度和噪声水...

14610

是否需要对因子进行『行业中性化』处理?

量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保...

10910

量化大厂开始搞游戏开发了!

量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保...

7410

用于时间序列概率预测的共形分位数回归

数据STUDIO

QR 估算的是目标变量的条件量值,如中位数或第 90 个百分位数,而不是条件均值。通过分别估计不同水平预测变量的条件量值,可以很好地处理异方差。虽然大多数情况下...

10310

时间序列概率预测的共形预测

数据STUDIO

在预测建模中,我们知道模型的目标是为条件均值给出无偏估计。估计值与实际样本值之间的差距被称为误差,体现了模型的不确定性。那么,如何量化这种不确定性呢?由于误差代...

15010

用于时间序列概率预测的分位数回归

数据STUDIO

分位数回归满足这一需求,提供具有量化机会的预测区间。它是一种统计技术,用于模拟预测变量与响应变量之间的关系,特别是当响应变量的条件分布令人感兴趣时。与传统的回归...

11010

大模型探索:阿里向量检索服务DashVector

程序员架构进阶

大模型无疑是这两年最火的概念,国内外各厂商都不甘示弱纷纷推出自己的大模型能力和应用。废话不多说,在实际的大模型应用中,向量检索服务无疑是目前不可缺少的一...

17010

湖仓一体 - Apache Arrow的那些事

yzsDBA

Arrow是高性能列式内存格式标准。它的优势:高效计算:所有列存的通用优势,CPU缓存友好、SIMD向量化计算友好等;零序列化/反序列化:arrow的任何数据结...

11510
领券


http://www.vxiaotou.com