欢迎来到天天文库
浏览记录
ID:53803918
大小:731.00 KB
页数:7页
时间:2020-04-07
《示例选择多示例学习总结.doc》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、MILIS:MultipleInstanceLearningwithInstanceSelectionFu,Z.;Robles-Kelly,A.;Zhou,J.;PatternAnalysisandMachineIntelligence,IEEETransactionsonVolume:PP,Issue:99DigitalObjectIdentifier:10.1109/TPAMI.2010.155PublicationYear:2010,Page(s):1-1IEEEEarlyAccessAbstract
2、 FullText:PDF (1453KB)
3、 这篇文章讲的是多示例学习。所谓的多示例就是指,每个样本有多个实例(){}组成,一个样本实际上是很多的集合()。作者所设计的方法用下面这个图可以全部概括出来了:C.ClassificationD.B.InitialInstanceSelectionA.Bag-LevelFeatureRepresentation7/7A.Bag-LevelFeatureRepresentation首先,我们介绍所谓的FeatureMapping,就是用{,},把一个bag映射成一个矢量:这样做的缺点是用所有的,太多了,映射成的矢量维数太高了,算起来太麻烦。作者说:不用,用
4、我的{},只每个Bag只取一个instance作为IP,放在IPs里来映射个:于是乎:这样一个B_i就变成了一个n维矢量,我们用一个SVM来分类就可以了。这篇文章的问题就是:1.如何为每个选择一个放在中?2.如何训练一个合适的SVM来分类?B.InitialInstanceSelection为了回答上面第一个问题,作者先初步地选择一些。在multipleinstancelearning中有个特点,就是positivebag吧,里面的instance有positive也有negative的,而,所以,关键问题是如何把哪些是positive的找出来。如果你是
5、小虾,肯定会想,建立一个positiveinstance的概率模型,然后算算看每个instance的概率,把概率最大的那些选出来。蠢呀!你训练样本中哪些是positiveinstance都不知道,怎么建立概率模型?作者的聪明之处在于:先建立:7/7这里用的是技术然后把些概率最小,不就最可能是正样本;然后概率最大的,不就最可能是负样本吗?1.对每个,我们,作为2.而对每个,我们就挑,作为IP。这样就初步地选出了IPs。这一步,用的是逆向思维。C.Classification有了,把表达成矢量之后,我们训练一个SVM来分类:7/7好了,到这里,让我们再仔细看
6、看上面那幅图:原来是迭代的:1.选择,形成新的矢量;2.用新的矢量训练SVM好了,现在问题是,训练好了SVM,如何选择一个更好的集合呢?D.InstanceUpdate如何没每个选一个呢?换言之,在的示例中,究竟该选择哪个?这里,就是中选出来到那个的序号:一共有n个,我们把所有放在一起,作为。这就是我们要求的结果了。现在是,在迭代中,如何根据(t)中的SVM系数,以及,来确定下一次的呢?7/7很简单,如果你还懂点迭代的思想的话,就是让和中除之外按兵不动,光求一个能让代价函数最小的就行了:但是,这样的计算复杂度太大了:因为对于每个(一共n个)都要做一次,而
7、这个计算要从项中找一个最小的。但是,作者注意到:其实各个是独立的,互相的更新并不干扰,而上面那个式子中的,可不可以不用对每一个都算一遍,而是借鉴上个的结果来算?沿着这个思路,作者提出了低复杂度的的计算方法:7/7输入是:输出是:过程是:1.先初始化2.然后挨个算每个训练集中的B_i的SVM输出:3.算SVM分类的代价函数值,就是把所有B_i的()加起来:4.然后,就是为每个B_i更新的时候了,这里,更新B_i的时候,可以随便用上B_i-1的结果,这也正是高效的原因所在,不是每个B_i单独算,而是用上个的结果接着算:要是代价函数是0,就不跟新了;不是0的用
8、下面方法更新:对B_i中的每个不是的instancej,算用j代替后的代价函数:7/7要是比当前的代价函数小,就把:更新为关键的是这一步:,这步算出了用j代替的代价函数,还有用j代替后,重新对每个B_i映射的矢量,以及这个矢量对应的SVM的输出:具体地,是如下实现的:代价函数初始化为零;要是代替了之后更糟糕了,为了配合主函数中的,给无穷大。好了,打完收工!启发:1.还是迭代的思想;2.逆向思维听有意思的,而且求密度的思想也可以借鉴;3.multipleinstance的方法,好像都是用instanceembedding作者,第二作者是个澳大利亚人,不晓得
9、招不招博后,要是招博后,钱肯定不少。7/7
此文档下载收益归作者所有