人工筛得干到明天。”
“没人说要人工筛。”李航已经打开本地开发环境,新建了一个项目目录,“我写个爬虫,定向抓取‘relatedpartytransactions’和‘contingentliabilities’这两个章节。只要文本里有‘guarantee’‘jointobligation’这类关键词,自动标记提取。”
“接口有限速,单线程跑太慢。”周婷靠过来看了一眼代码框架,“用多进程伪装成不同ip请求,再加随机延时,绕过反爬机制。”
“你负责清洗数据格式。”李航快速敲下几行调度指令,“我要把结果结构化,生成一个担保强度评分表。”
“评分标准呢?”周婷问。
“不能只看金额。”陈帆插话,“要看担保方自身的负债率、现金流状况、以及它自己是否也被别人担保。形成一张网,越深处,风险传导越强。”
周婷立即开始设计算法逻辑。她在白板上画出节点关系图,定义权重系数:主担保方基础分设为1.0,若其资产负债率超过70%,乘以1.3;若自身存在对外担保,则每增加一层递归,附加0.2的传导风险值。
张磊则切换到服务器资源监控界面,盯着cpu和内存占用曲线。“你们两个别同时拉大数据量,上次并发太高差点烧了主板。”
“我知道节奏。”李航一边调试代理池一边说,“先小批量试跑五十家,确认数据稳定再扩展。”
陈帆回到主控台,重新加载最新的市场行情包,包括昨夜欧洲科技股的表现、美元流动性指标变化,以及美联储官员讲话纪要。他把这些作为背景变量,准备等担保数据一到位就重新建模。
十分钟后,李航的第一批数据返回。屏幕上跳出一个表格,列出二十家存在明显交叉担保行为的公司,其中三家已被列入信用观察名单。
“找到了。”李航放低声音,“这家服务器制造商,给旗下五家子公司做了全额履约担保,而其中一家又反过来为另一家关联设计公司提供贷款质押。典型的闭环结构。”
陈帆放大其中一家子公司的财务摘要。去年第四季度净利润下滑41%,经营性现金流首次转负,但股价在过去两周逆势上涨6%。
“有人在撑。”他说,“只要这个体系里有一家倒下,其他几家的担保责任就会立刻激活,债权人有权追索。到时候不是一家破产,是一片崩塌。”