资源描述:
《大数据,机器学习基础》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、正则表达式d可以匹配一个数字,w可以匹配一个字母或数字s表示一个或多个空格・匹配任意单字符?表示0个或1个字符*表示任意个字符(包括0个)+表示至少一个字符{n,m}表示n-m个字符这几个都是可以加在具体匹配内容的后面的如d{3}s+w{3,8}表示3个数字至少有一个空格3・8个任意字母或数字[a-zA-Z_][0-9a-zA-Z_]*由字母或下划线开头,后接任意个由一个数字、字母或者下划线组成的字符串(数量不定)(P
2、p)ython可以匹配Python或者'python'八表示行的开头$表示行的结束yy$就是这一行
3、中只能有py两个字母Python的一般匹配写法是:ifre.match(r,Aw{3}\-d{2}$',test)re要提前importMatch之后看结果是group=re.match(...)里面写法一致,group(O)…就看内容Aor1(强行变成二或>的奇数)(Aor1)・1(强行变成二或<的偶数)0A0=0,0A仁10异或任何数=任何数1A0=1,1A1=01异或任何数・任何数取反任何数异或自己二把自己置0xor运算的逆运算是它本身,也就是说两次异或同一个数结果不变,即(axorb)xorb=a定义两个符号#和@这
4、两个符号互为逆运算,也就是说(x#y)@y二xx<-x#yy<-x@y这三句话的结果是,X和y的位置互换了。xor的逆运算是它本身,于是我们就有了一个看起来非常诡异的swap过程:a:=axorb;b:=axorb;a:=axorb;把右数第k位变成1
5、(101001->101101,k=3)
6、xor(1shl(k-1))把右数第k位变成0
7、(101101->101001,k=3)
8、xandnot(1shl(k-1))去掉右起第一个1的左边
9、(100101000->1000)
10、xand(xxor(x-1))intabs(intn){
11、return(nA(n»31))・(n»31);/*n»31取得n的符号,若n为正数,等于0,若n为负数,n»31等于若n为正数20二0,数不变,若n为负数有nA-1需要计算n和的补码,然后进行异或运算,结果n变号并且为n的绝对值减1,再减去畀就是绝对值*/}intmax(inta,intb){取两数最大值returnb&((a-b)»31)
12、a&(~(a・b)»31);广如果a>=b,(a-b)»31为0,否则为-VI}intnum二0;while(n){n&二(n・1);num++;}把一个整数减去1,再和原整数做与运算,会把该
13、整数最右边一个1变成0。那么一个整数的二进制表示中有多少个1,就可以进行多少次这样的操作。用一条语句判断一个整数是不是2的整数次方:!(x&(x・1))每个阶段只有一个状态・>递推;每个阶段的最优状态都是由上一个阶段的最优状态得到的・>贪心;每个阶段的最优状态是由之前所有阶段的状态的组合得到的亠搜索;每个阶段的最优状态可以从之前某个阶段的某个或某些状态直接得到而不管之前这个状态是如何得到的亠动态规划。我所了解的卡特兰数有关的问题,大都满足这样一个描述:有一个大问题A,规模为n,要解决这个问题,可以用分治的思想,首先固定其中某一个元素
14、,将剩下的个元素拆分成两个小问题,这两个小问题的规模分别是(0,n-1)(1,n-2)(2,n-3)...(n-1,0)举几个例子:1.二叉树计数,n个结点的二叉树,首先固定根节点,将剩下的n・1个结点拆分给左右子树2.三角形划分问题,凸(n+2)边形可以划分为n个三角形,首先固定一条边(即一个三角形),这个三角形将这个(n+2)边形拆分成两个更小的多边形。3.在n*n的格子中,只在下三角行走,每次横或竖走一格,有多少中走法?4.用/?个长方形填充一个高度为77的阶梯状图形的方法个数通项公式(2n)!(n+l)!n!好像这个公式只关
15、注项数n因为/(加)・J;/(2O/(2n-2i-2)■/(0)•/(2n2)V(2)・/(2/»-4)+・・・”(2/r4)・/(2)+/("2)・/(0)这样的通项公式也是数据库主键选择方案数据库主键的作用是唯一标识一条记录,所以在同一张表中,任意一条记录的主键都是唯一的。主键的有个作用是让其他表的外键引用自己,从而实现关系结构。一旦某个表的主键发生了变化,就会导致所有引用了该表的数据必须全部修改外键。所以实践中数据库主键几乎不可更改。主键必须使用单独的,完全没有业务含义的字段,也就是主键本身除了唯一标识和不可修改这两个责任外,
16、主键没有任何业务含义。主键建议使用字符串。因为主键的本质是保证唯一记录,并不要求主键是连续的。实际上不连续的更好,这样既避免了运营数据泄,也给黑客预测ID制造了障碍,具有更高的安全性。一般方案是自定义一个算法,时间戳放高位,序列号放低