Tags: OpenPPL/ppq
Tags
onnx 模型导出与算法更新 (#231) * 添加样例文件 * onnx模型导出与算法更新 * 为dump_torch_to_onnx函数添加了默认参数 * EXPORT_OVERLAPPED_CONFIG 现在是过时参数,你将使用TQC上的QuantizationVisiblity属性来进行导出控制。该属性有三个可选项:强制导出、TQC激活时导出、不导出。 * 修改了 exporter 逻辑以适配新的QuantizationVisiblity属性 * 修改了onnx qdq的导出逻辑,现在将尽可能消除对称量化中的激活函数。 * 修改了 graphwise analyser 的逻辑,现在允许分析多输出算子的误差 * 修改了 layerwise equalization 的逻辑,现在允许 include act,支持conv1d, conv2d conv3d, convtranpose1d, convtranspose2d, convtranspose3d, gemm, matmul * 修复了 passive parameter pass 中的 pad 量化错误 * 修复了 quant alignment pass 中 pooling 算子的对齐错误 * 修复了 核心量化函数在启动 cuda kernel 的情况下无法处理 cpu tensor 的问题 * 修改 openvino 量化策略,负数部分现在可以取到-128(曾经是-127) * 给 dsp quantizer 添加了一个新的量化类型 * 添加测试样例 * 修复ci错误