
我们首先使用ou ain社群发现算法对整体企业关联图进行划分。以2021年年报结果为例,我们基于ou ain算法将所有的4965个企业节点划分为1个一行业分类,67个二行业分类。以二行业分类为例,除开定量分析,我们也需要知道分类中的企业有哪些共同的特征。因此,我们在此计算ou ain二行业分类下各个组的GICS四行业收入分。行业分类收入分类似于指数行业分布,只是此时我们计算的不是指数中个股所属行业的数目比 ,而是个股在GICS行业分类上的收入。对于一个用于K个企业的行业分类,我们按照如下方式计算其行业收入分:
1.在含有𝐾个企业的一个组中,我们可得到𝐾个度为114(对应114个GICS行业分类)的行业营收占比向量,则集合𝑉=
2.对于K个向量,我们对它们进行累加,并除以该二分类中的营收总和,得到𝑣=(∑𝑣,∑𝑣,…,∑𝑣
我们结合基于2021年报计算的ou ain二分类结果,选取了以电气部件与设备为中心的组,计算GICS四行业收入分。我们选择在分组中占比最高的前5个GICS行业进行展示。
下述四张表格分别为重构二行业分类Group40、59、8、41,四个组的行业收入分饼图。这四组中,占比最高的前5个GICS行业收入比和均大于70%,其中建筑与工程均在前三。根据分类的行业分,我们对划分原因进行归纳总结,将其归结为三种原因:单一主业务、双主业务、以及多主营业务。