TAG · 标签

#技术深度

测评技术、方法论、工具链与工程实践

大模型应用企业落地测评清单:功能性 + 准确率 + 安全性 + 幻觉率 7 大维度详解(2025)
技术深度 2025.05.16 9 min read

大模型应用企业落地测评清单:功能性 + 准确率 + 安全性 + 幻觉率 7 大维度详解(2025)

2025 年大模型走过 PoC 阶段,正大规模进入企业核心业务。然而幻觉、Prompt 注入、合规风险、长 session 漂移等问题暴露了“能用”与“敢用”之间的鸿沟。本文系统梳理企业落地大模型必须覆盖的 7 大测评维度——功能性、准确率、幻觉率、安全性、合规性、稳定性、公平性,每个维度配套客观指标、行业基线与典型 fail case,并整理可立即上手的开源与商业测评工具栈。

阅读全文 →
APP / 小程序专项测试清单(12 大差异 + 全维度检查项)
技术深度 2024.11.21 6 min read

APP / 小程序专项测试清单(12 大差异 + 全维度检查项)

APP/小程序测试与 PC 软件 12 项核心差异:兼容性、隐私合规、性能、安全。依据 GB/T 25000.51-2016 与工信部专项整治要求。新亿诚覆盖主流厂商真机机型。

阅读全文 →
小程序备案合规检测 5 大要点(2024 强制要求 + 备案材料清单)
政策解读技术深度 2024.11.15 5 min read

小程序备案合规检测 5 大要点(2024 强制要求 + 备案材料清单)

2024 年起小程序需在主管部门备案,备案时需提供个人信息保护合规检测报告、内容安全检测报告等。本文按工信部《移动互联网应用程序信息服务管理规定》拆解备案 5 大要点 + 第三方测评机构在其中的介入点 + 常见踩坑场景。

阅读全文 →
渗透测试 vs 漏洞扫描的区别(方法论、深度、价格、何时该用哪种)
技术深度 2024.08.19 6 min read

渗透测试 vs 漏洞扫描的区别(方法论、深度、价格、何时该用哪种)

渗透测试与漏洞扫描经常被混为一谈,但二者本质不同。新亿诚具备丰富的渗透测试与漏洞扫描实战经验,本文给出完整对比、典型场景、采购建议。

阅读全文 →
软件验收测试常见 5 类缺陷及修复路径(含整改时间表)
技术深度案例研究 2024.08.15 5 min read

软件验收测试常见 5 类缺陷及修复路径(含整改时间表)

软件验收测试不通过怎么办?根据 200+ 项目数据,验收阶段发现的缺陷 80% 集中在 5 类:功能符合性偏离、性能基线不达标、安全漏洞、兼容性缺失、文档不完整。本文逐类拆解缺陷成因、修复路径、整改时间预算,帮甲乙双方建立合理预期。

阅读全文 →
软件性能测试关键指标解析(TPS、响应时间、SLA 全维度)
技术深度 2024.05.20 5 min read

软件性能测试关键指标解析(TPS、响应时间、SLA 全维度)

软件性能测试 6 大关键指标:并发用户数、TPS、响应时间、资源利用率、错误率、可用性。依据 GB/T 25000.51-2016。新亿诚具备丰富的性能测试报告交付经验。

阅读全文 →
软件功能性测试是怎么测的(测试范围、用例数量、报告内容、收费区间)
技术深度 2024.02.18 6 min read

软件功能性测试是怎么测的(测试范围、用例数量、报告内容、收费区间)

软件功能性测试依据 GB/T 25000.51-2016 国家标准,由第三方测评机构对软件能否完成预期功能做系统化验证。本文从测试范围、用例数量、报告内容、收费区间四个维度讲清楚功能性测试。

阅读全文 →
验收测试 / 确认测试 / 鉴定测试:B2B 测评三大场景如何选型?
技术深度 2023.09.12 9 min read

验收测试 / 确认测试 / 鉴定测试:B2B 测评三大场景如何选型?

项目验收、产品确认、成果鉴定——三种第三方软件测试报告,目的、委托方、报告用途各不相同。一张图、一张表帮你判断你的项目属于哪一类。

阅读全文 →