资源描述:
《内核路由模块分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、(一)概述路由策略数据库(RPDB)路由部分结构整个路由系统可以分成三部分:IP层调用接口,路由策略数据库,和前后端接口1、IP层调用接口主要是提供一组调用接口给IP层代码:这一部分主要提供了两个供IP层调用的入口函数:intip_route_input(structsk_buff*skb,u32dst,u32src,u8tos,structnet_device*dev);intip_route_output(structrtable**rp,u32daddr,u32saddr,u32tos,intoif)ip_route_input_slo
2、w:当ip_route_input查cache不命中时调用此函数,此函数进而调用路由策略数据库的查询接口进行查询,然后更新路由cache。ip_route_output_slow:当ip_route_output查cahe不命中是调用此函数,此函数进而调用路由策略数据库的查询接口进行查询,然后更新路由cache。2、路由策略数据库部分主要包括一个策略库和多张路由表:① 策略表fib_rule每个策略是一个fib_rule结构。这个结构有几个重要的域:r_preference这个策略的优先级。r_table这个策略对应的路由表,它是路由表索引表
3、fib_tables的一个索引值。r_action策略的动作,如单播,丢弃,NAT等。r_src,r_srcmask,r_dst,r_dstmask,r_tos等 策略的选择器,即描述什么样的IP包匹配这条策略。②路由表fib_table定义如下:structfib_table*local_table;structfib_table*main_table;structfib_table*fib_tables[RT_TABLE_MAX+1];它的数据结构是:structfib_table{unsignedchartb_id;unsignedtb
4、_stamp;int (*tb_lookup)(structfib_table*tb,conststructrt_key*key,structfib_result*res);int(*tb_insert)(…);int(*tb_delete)(…);int(*tb_dump)(…);int(*tb_flush)(structfib_table*table);int(*tb_get_info)(…);void(*tb_select_default)(…);unsignedchartb_data[0];};fib_table结构只是一个
5、路由表结构中最上层的一个结构,它下面还很多的层次,下面这张图描绘了整个路由表的数据结构:第一个层次是fib_table和fn_hash结构。实际上,fn_hash结构即是fib_table的tb_data域。这一层主要是包括一个路由表所对应的标识符(tb_id),操作函数指针(tb_looup等),以及对所有路由项的一个总索引(fn_hash结构)。最为重要的就是这个索引,一个路由表把它所有的路由项划分成33个区域,划分的原则即是子网掩码的长度(从0到32),这33个区域分别对应着fn_hash结构中的fz_zone[0]到fz_zone[3
6、2]。之所以这么划分的原因就因为,路由的表的查找要从最精确到最不精确,也就是说要从掩码最长的路由项查起。第二个层次是fn_zone结构。每个fn_zone代表了一个区域,由于并不是33个区域都会同时存在,一般往往只有常用到的掩码长度(如0,16,24,32位)对应的区域才存在,所以所有存在的区域按从大到小的顺序被链成一个list,从而提高查找的效率。这人fn_zone结构中最重要的就是fz_hash域了,它指向了一个hashtable,这个hashtable组织了这个区域下的所有路由项。第三个层次是代表路由项的fn_node结构。它是hash
7、table的结点,其中fn_key域即是hash查找的关键字,它实际上就是路由项的目标网络号。这个结构的提供了路由查找的结果信息,fn_type这个域指示了这个路由项的含义:单播转发,本地,丢弃,NAT等等。对于大多数情况,路由项都是单播转发类型的,这时关于下一跳的信息就入在fn_info中了,它指向一个fib_info结构。第四个层次即是fib_info结构。因为很多的路由项具有相同的下一跳信息,即fn_node与fib_info结构是多对一的关系。所以fn_node中只存放一个指向fib_info的指针fn_info。所有fib_info
8、结构被单独管理,它们被组织成一个双向链表,表头为fib_info_list。关于下一跳的具体信息由fib_nh[]数组指示,它是一个数组意味着一个下一跳决策可以对应