12月30日,上海合合信息科技股份有限公司(下称“合合信息”)回复科创板IPO首轮问询。
图片来源:上交所官网
在首轮问询中,上交所主要就合合信息科创属性、实控人、经营资质、数据合规性、业务、研发费用、股东与股权变动、募投项目等21个问题。
关于科创属性,根据招股说明书,(1)公司是一家人工智能及大数据科技企业,属于软件和信息技术服务业;(2)公司针对核心底层技术进行战略性研发,持续积累底层技术和通用技术方案,拥有17项核心技术,复杂场景文字识别、智能图像处理、自然语言处理、知识图谱及大数据挖掘等核心技术均处于行业领先水平,其中智能文字识别技术领域处于世界领先地位;(3)报告期内互联网广告推广业务收入为1,559.42万元、2,540.96万元、4,155.71万元、1,493.55万元。
上交所要求发行人说明:(1)发行人产品及服务与国家科技创新战略和相关产业政策的匹配情况,是否属于国家战略重点支持的领域;(2)发行人技术来源,底层技术和通用技术的具体内涵、技术门槛、行业技术水平及成熟度,底层技术系发行人原创、还是在行业通用技术上的改良创新或直接应用;(3)发行人核心技术主要为行业通用技术还是专有技术,技术实现是否依赖第三方硬件,与行业内主要竞争对手的先进性对比情况,“行业领先”、“世界领先”相关表述是否客观准确,如否请删除或修改表述;(4)结合发行人互联网广告推广业务收入变动情况及趋势、发行人业务与技术实质等,说明发行人是否为模式创新企业,是否符合科创板定位。
合合信息回复称,报告期内公司各类产品及服务产生的收入如上表所示,其中智能文字识别业务包含扫描全能王、名片全能王C端APP收入以及B端服务收入,商业大数据业务包含启信宝C端APP收入以及B端服务收入,手机厂商技术授权业务为面向三星、OPPO等手机厂商预装文字识别技术模块业务收入,互联网广告推广为基于公司APP的互联网广告推广服务收入。智能文字识别业务与商业大数据业务收入之和占报告期各期总收入比例分别为77.07%、86.48%、90.30%、90.26%,因此重点分析发行人智能文字识别业务、商业大数据业务与国家科技创新战略和相关产业政策的匹配情况。
发行人智能文字识别与商业大数据的产品及服务与国家科技创新战略和相关产业政策匹配,属于国家战略重点支持的领域。
发行人的技术来源为研发团队的自主研发和创新。经过多年持续不断的研发、实际落地应用的总结和积累,发行人形成了自主研发及创新体系。
公司成立于2006年,在公司发展早期,2006-2009年主要为公司沉淀文字识别的核心技术,打造文字识别技术壁垒时期。后续公司逐步开发了C端产品及B端服务矩阵,具体如下:(1)在文字识别C端APP领域,2009年-2010年,公司名片全能王、扫描全能王两款以文字识别和图像处理技术为核心的APP相继上线,2016年,公司将深度学习算法、自然语言处理技术与OCR技术相结合,自主研发智能文字识别技术,大幅度提升了智能文字识别技术的性能和应用场景,并将AI技术落地成为产品级应用;(2)在文字识别B端企业服务领域,2016年,公司正式成立企业级智能解决方案事业部,布局行业头部客户,输出超过100种证照的OCR基础模块服务,2017年开始,公司针对不同行业复杂场景的文字识别进行更多元化的商业化探索,加速布局智能文字识别AI机器人、AI训练平台等场景化解决方案,并陆续开发了多元化行业的B端客户;(3)在大数据领域,2015年公司收购了企业公开数据治理服务商苏州贝尔塔。
收购后,公司利用自身强大的开发能力快速推出了启信宝APP,作为向大众用户提供企业信息查询及商业调查服务的平台,2016年,公司建立内部的大数据平台部门,有效的推动了公司大数据平台的快速发展,2017年,公司利用自主研发的启信宝企业版SaaS软件快速切入商业大数据B端服务领域;2018年,公司自主研发的企业知识图谱解决方案开始进行商业落地,并陆续开发了多元化行业的B端客户。
截至2021年3月31日,公司全职员工共753人,其中研发人员共435人,占总人数比重约58%,研发人员主要是算法研发、数据挖掘、产品开发、产品测试等方面的技术人才。报告期内,公司不存在核心技术人员变动情况。
2018年度、2019年度、2020年度及2021年1-3月,公司研发费用(含股份支付)分别为12,804.96万元、21,058.73万元、16,696.80万元及5,051.31万元。公司通过保持高水平的研发投入力度,从人力、物力、财力等方面保障核心技术为自主研发以及研发的可持续发展。
综上所述,发行人的技术来源为自主研发。
发行人核心技术主要为专有技术,非直接运用行业的通用技术,技术实现未依赖第三方硬件,发行人技术先进性的相关表述具有客观依据,为保证相关表述的严谨性,发行人已将技术“行业领先”、“世界领先”等相关表述进行修改。
公司以C端APP产品为主要载体,在APP启动封面、展示页等广告位向客户展示品牌广告和效果广告,提供广告营销服务。
报告期内公司广告收入增加主要是由于C端APP合计用户月活持续增长,2018年、2019年、2020年以及2021年1-3月,扫描全能王、名片全能王及启信宝的平均月活用户之和分别为6,598.10万人、9,928.53万人、11,456.18万人、11,312.94万人,除2021年1-3月是由于春节假期影响月活水平稍有回落,2018-2020年公司C端APP月活保持较快的成长速度。而公司C端APP用户基数持续增长的主要驱动因素之一是由公司先进的底层技术、技术落地能力、持续性的研发投入造就的优异的产品体验与用户口碑。
报告期内公司广告收入占相应期间公司营业收入总额比例分别为7.95%、7.46%、7.19%、8.73%,非公司收入主要来源,互联网广告推广业务是C端APP行业内企业通常采取的流量变现手段,非公司核心业务。另外公司注重用户体验,而APP启动封面、展示页等广告会一定程度上影响用户体验与产品口碑,因此公司未来不会大幅度提升C端APP的广告位、将广告收入作为C端APP的主要收益。
如本题前述相关回复内容所分析,发行人是技术创新企业,将自主创新的人工智能及大数据相关的核心技术,结合各细分行业的场景化需求,在公司C端和B端主营业务中全面应用,覆盖了C端数亿级端用户与银行、证券、保险、政府、物流、制造、地产、零售等近30个行业B端客户,解决客户降本增效、改善风控、高效获客的痛点,助力客户实现数字化与智能化转型,技术优势是公司最核心的竞争优势。因此,发行人业务与技术实质是属于人工智能及大数据领域的技术创新企业,发行人不属于模式创新企业,符合科创板定位。
关于数据合规性,根据招股说明书,(1)公司的大数据获取主要有两种途径,分别是向供应商(包括个人)采购的企业数据、自动化访问获取的企业数据;(2)为保障数据采购的供应商数据来源的合法合规性,公司采取了制定管理规范、通过多种方式调查供应商等措施。
根据申报材料,报告期内,公司存在数据管理相关内控制度有待进一步完善、与部分数据供应商的合作协议中数据供应商未明确承诺数据来源合法合规、App用户隐私协议中未明确约定采集数据的使用范围等问题。
上交所要求发行人说明:(1)发行人各项业务及研发分别获取、存储、使用哪些数据,对应的数据来源、数据权属,是否存在销售数据的情形;(2)发行人向个人供应商采购数据的主要内容、比例及原因,价格公允性,该等个人是否与发行人及其客户、其他供应商存在关联关系或利益安排;(3)发行人来源于供应商采购和自主获取的大数据的区别及报告期内占比,自动化访问获取的企业数据如何确保来源合法性,发行人调查供应商及数据来源合法性的具体方式及有效性;(4)报告期内发行人数据管理不完善的具体情形、影响范围、严重程度,是否存在侵权行为、纠纷、潜在纠纷或可能被处罚的情形,目前发行人针对该等不完善情形的具体整改情况及效果,发行人数据合规纠纷的解决机制;(5)发行人关于获取、存储、使用数据的相关制度规范的制定时间、主要内容、执行情况,是否能够有效保障数据安全及业务合法合规;(6)近年关于数据安全、个人信息保护等立法对发行人研发、采购、销售等的影响,发行人业务开展是否符合该等法律法规规定,是否存在本次发行上市未履行的前置程序或其他障碍,相关风险揭示是否充分。
合合信息回复称,发行人存在销售数据的情形,发行人销售的是对原始数据加工、处理后的标准化产品:公司的智能文字识别C端业务提供智能文字识别,主要用户在“扫描全能王”、“名片全能王”APP,由其自主上传文档、图片以及订单开票数据,利用APP进行文字及图像识别。B端业务是为客户提供基础数据、标准化服务(名片全能王企业版SaaS软件服务)、场景化解决方案,主要为B端企业用户提供的企业信息或者SaaS软件。
公司的商业大数据业务C端业务方面,C端用户登录启信宝APP后,可以通过对按期间收费的VIP会员、付费报告等单次付费产品从而获得经公司整理、格式统一、结构化处理及深度清洗加工后的企业经营信息、工商数据等;B端业务方面,公司根据B端客户需求特点、产品种类、场景化程度、技术复杂度等因素综合对相关数据进行挖掘分析和处理,最终形成给B端客户的解决方案或标准化SaaS软件。
公司开展B端商业大数据业务、C端启信宝APP的主要数据来源是公司数据中台汇聚的企业数据。公司开展B端商业大数据业务不会利用C端的用户数据(包括但不限于C端用户注册数据、C端用户上传的文档、名片)。发行人不存在直接将从供应商以及自动化采集获取的原始数据直接销售给第三方的情形。
报告期内公司存在向自然人采购企业信息数据的情形,采购的主要内容为企业历史工商数据和个体工商户数据,相关数据内容指工商公示的企业和个体工商户的最新工商基本信息,包括公司名称,注册号,社会信用代码,经营范围,股东列表,行政处罚,股权出质情况等,以及该等信息历史变化情况,包括历史名称,历史股权出质记录,历史股东等。该个人供应商曾在百度研发中心工作,具有较强的技术背景,曾经通过自动化采集等手段获取了国家工商公示系统对外公示的工商信息,其中包含公司所需的企业历史工商数据和个体工商户数据,能够满足公司大数据业务发展的需求,因此双方就数据采购达成合作。公司于2018年4月向该个人供应商支付160万元作为数据采购费用,占2018年数据采购金额的比例为47.13%。
此次数据采购完成后,公司安排自有技术团队通过自动化采集的方式采集并留存相关企业工商历史信息和个体工商户信息,并通过向凭安征信和人民数据采购工商信息来对数据库进行完善。因此对于此类信息,公司未再对外进行过其它采购。
除上述采购外,公司不存在其他向个人供应商采购数据的情况。
此次数据采购完成后,公司安排自有技术团队通过自动化采集的方式采集并留存相关企业工商历史信息和个体工商户信息,并通过向凭安征信和人民数据采购工商信息来对数据库进行完善。因此对于此类信息,公司未再对外进行过其它采购。除上述采购外,公司不存在其他向个人供应商采购数据的情况。
公司的工商数据供应商主要为凭安征信和人民数据。
2019年12月,公司与凭安征信签订采购合同,约定采购内容为全国工商企业名录,合同有效期为12个月,合同金额为240万元,其中一半为数据采购费用,一半为数据更新费用;2020年9月,公司与人民数据签订采购合同,约定采购内容为工商大数据(公开数据),合同有效期为12个月,合同金额为450万元,其中一半为数据采购费用,一半为数据更新费用。
2018年公司向个人供应商数据采购单价与公司向凭安征信及人民数据采购平价单价不存在明显偏离,具备公允性。
该个人供应商系技术领域从业人员,曾在百度国际科技(深圳)有限公司国际化产品研发中心工作,具有较强的技术背景。该个人供应商与发行人及其客户、其他供应商不存在关联关系或利益安排。
发行人的业务开展符合《中华人民共和国网络安全法》等法律法规规定,不存在本次发行上市未履行的前置程序或其他障碍,相关风险揭示已在招股说明书中充分披露。