Hello World | Adel Zhang

2012年1月18日星期三

euler 3: Largest prime factor

题出自 Project Euler Problem 3:
The prime factors of 13195 are 5, 7, 13 and 29.
What is the largest prime factor of the number 600851475143 ?

我自己的解法思路是先判断该数（记为A）是否为prime，如果是，则直接返回它本身。否则从该数的一半开始（记为index)，判断index是否能被A整数以及index是否是prime，当两者同时满足时，返回index，否则index自减1。判断某数是否为prime的算法，是从该数的平方根数开始一个一个检查。代码如下:

#include <stdio.h>
#include <math.h>

//#include <limits.h>

int is_prime(long l);
long largest_prime_factor(long l);

int main(int argc, char *argv[])
{
  long result = largest_prime_factor(600851475143L);
  printf("%ld\n",result);
  return 0;
}

int is_prime(long l){
  long l_sqrt = (long)sqrt(l);
  long i = 2L;
  for(; i <= l_sqrt; i++){
    if(l % i == 0)
      return 0;                 /* is not prime */
  }

  /* is prime */
  return 1;
}


long largest_prime_factor(long l){
  if(is_prime(l))
    return l;
 
  long l_mid = l/2;
  long l_ind;
  for(l_ind = l_mid; l_ind >=2; l_ind--){
    if((l%l_ind == 0) && is_prime(l_ind))
      return l_ind;
  }

  return 1; // never come here
}

上面的算法很惨，算了几十分钟都没有算出结果。所以最后我放弃了，google到了下面这个算法:

#include <stdio.h>

long largest_prime_factor(long l);

int main(int argc, char *argv[])
{
  long result = largest_prime_factor(600851475143L);
  printf("%ld\n",result);
  return 0;
}

long largest_prime_factor(long l){
  long factor = 2L;
  while(l > 1L){
    while(l % factor == 0 ){
      l = l / factor;
    }
    factor++;
  }

  return (factor-1);
}

细想一下，这个算法与筛选法类似。但是，我怎么就没想到呢？FAIL！！！

2012年1月6日星期五

cURL “虾米” 签到的小脚本

这个脚本用于登陆虾米网站，并进行签到。虽然只是个二三十行的脚本，但由于对cURL不甚
了解，还是搞了几天。主要的经验有:

curl 用 -d 发送表单时，要把按钮的值也加进去("submit=登录")
curl 处理 ajax，应该通过分析javascript脚本，找到真正接收请求的url
curl 模拟 ajax时，添加 HTTP头 "X-Requested-With: XMLHttpRequest"，更好的方法是观察实际的HTTP头，并构造出个一样的
总之，分析浏览器的HTTP请求，再用 cURL构造即可。

#! /bin/bash

declare -r SCRIPT="${0##*/}"

SITE="http://www.xiami.com"
USERAGENT="Mozilla/5.0 (compatible; MSIE 6.0; Windows NT 5.0)"
COOKIEFILE="cookie.txt"

USER="********@gmail.com"
PASSWORD="******"

# 检测cookie
if [[ ! -e $COOKIEFILE ]];then
    # 登录xiami
    curl -c $COOKIEFILE -d "email=$USER&password=$PASSWORD&submit=登录"  "$SITE/member/login"
fi

# 单击"签到"
curl -s  -b $COOKIEFILE -A "$USERAGENT" -e "$SITE" -H "X-Requested-With: XMLHttpRequest" -X POST -d "" "$SITE/task/signin" --retry 5 -H "Connection: keep-alive" 1>/dev/null

# 删除cookie
#rm $COOKIEFILE

2012年1月1日星期日

判断无符号整数二进制中1的个数(外一则)

三种算法。

算法1：
比较容易想到的算法，逐位比较，最多需要32次。

int count_ones_01(unsigned int n)
{
    int i;
    for(i = 0;n > 0;n >>= 1)
         i += (n&1);
    return i;
}

算法二：
Monster级算法。比较次数比算法1少，最多需要32次(如果int长度为32位的话)。

int count_ones_02(unsigned int n){
  int count=0;
  while(n>0){
    n &= (n-1);
    count++;
  }
  return count;
}

算法三：
二分法。遗憾的是不具有跨平台性。运算次数为5次(\(\log_{2}{32}\))

int count_ones(unsigned int n)
{
    n = (n & 0x55555555) + ((n >> 1) & 0x55555555);
    n = (n & 0x33333333) + ((n >> 2) & 0x33333333);
    n = (n & 0x0f0f0f0f) + ((n >> 4) & 0x0f0f0f0f);
    n = (n & 0x00ff00ff) + ((n >> 8) & 0x00ff00ff);
    n = (n & 0x0000ffff) + ((n >> 16) & 0x0000ffff);

    return n;
}

算法的思路是这样的：2位为一组，相加，看看有几个1。再4位为一组，相加，看看有几个1，
以此类推。
为了简单说明，先看看8位的情形。

x = (x & 0x55) + ((x >> 1) & 0x55);    (1)
x = (x & 0x33) + ((x >> 2) & 0x33);    (2)
x = (x & 0x0f) + ((x >> 4) & 0x0f);    (3)
return x;

对于语句(1)

当x=11111111

x= (x & 0x55) + ((x >> 1) & 0x55);

之后x=10101010。你2位2位地看，10=2, 就是2 2 2
2, 就是说各组都是2个1。

当x=00101001

x= (x & 0x55) + ((x >> 1) & 0x55);

之后x=00010101。你2位2位地看，就是0 1 1 1, 前
1组只有0个1，后面的组都是1个1。

接着看语句(2)

当x=abcdefgh

x=(x & 0x33)+((x >> 2)&0x33);

相当于 00cd00gh +　00ab00ef。

因为语句(1)之后，每两位表示该两位有几个１，相加就指示每4位有多少个1。这样就是4位
4位为一组。注意这样的分组，组与组之间永远都不会产生进位的。正因为不会产生进位，才
可以分开来看。

8位，16位，32位依上类推。

外一则：
利用算法三类似的思想，进行反转一个字节的二进制次序。

unsigned char reverse8( unsigned char c )
{
     c = ( c & 0x55 ) << 1 | ( c & 0xAA ) >> 1;
     c = ( c & 0x33 ) << 2 | ( c & 0xCC ) >> 2;
     c = ( c & 0x0F ) << 4 | ( c & 0xF0 ) >> 4;
     return c;
}

2011年12月28日星期三

最大的子序列和问题

最大的子序列和问题描述：
给定整数A1,A2，…,AN,求SUM(Ak),k从i到j，的最大值。为了方便起见，如果所有整数均为
负数，则最大子序列和为0。

例：
输入-2,11,-4,13,-5,-2时，答案为20(从A2到A4)

最大子序列和问题的解。
算法一：
穷举,复杂度为O（N^3）

int maxsubsequencesum(const int A[],int N){
    int thissum,maxsum,i,j,k;
   
    maxsum=0;
    for(i=0;i<N;i++)
        for(j=i;j<N;j++){
                thissum=0;
                for(k=i;k<=j;k++)
                        thissum += A[k];
               
                if(thissum > maxsum)
                        maxsum = thissum;
        }
    return maxsum;
}

算法二：
对算法一进行优化，减少内循环，复杂度为O(N^2)

int maxsubsequencesum_2(const int A[],int N){
    int thissum,maxsum,i,j;
   
    maxsum=0;
    for(i=0;i<N;i++){
        thissum=0;
        for(j=i;j<N;j++){
             thissum += A[j];
                    
             if(thissum > maxsum)
                   maxsum = thissum;
        }
    }
    return maxsum;
}

算法三：
分治：最大子序列可能在三处出现，或者整个出现在数据的左半部，或者整个出现在右半部，
或者跨越输入数据的中部而占据左右两半部分。前两种情况可以递归求解，第三种情况的最
大和可以通过求出前半部分的最大和（包含前半部分的最后一个元素）以及后半部分的最大
和（包含后半部分的第一个元素），将这两个和相加而得到。
复杂度为O（NlgN）

int maxsubsum(const int A[], int left,int right){
    int maxleftsum,maxrightsum;
    int maxleftbordersum,maxrightbordersum;/*包含边界的最大值*/
    int leftbordersum,rightbordersum;
    int center,i;

    if(left == right){
         if(A[left] > 0)
             return A[left];
         else
             return 0; /*由题给条件，负数的最大子序列长度为0*/
    }

    /* divide */
    center = (left + right)/2;
    maxleftsum = maxsubsum(A,left,center);
    maxrightsum = maxsubsum(A,center+1,right);

   /*conquer*/
   maxleftbordersum=0;
   leftbordersum=0;
   for(i=center; i>=left;i--){
       leftbordersum += A[i];
       if(leftbordersum > maxleftbordersum)
          maxleftbordersum = leftbordersum;
   }

  maxrightbordersum=0;
  rightbordersum=0;
  for(i=center+1; i <= right; i++){
      rightbordersum += A[i];
      if(rightbordersum > maxrightbordersum)
          maxrightbordersum = rightbordersum;
  }

  /* max3 取三者最大值 */
  return max3(maxleftsum, maxrightsum, maxleftbordersum + maxrightbordersum);
}

int maxsubsequencesum_3(const int A[], int N){
    return maxsubsum(A,0,N-1);
}

算法四：
在线算法，复杂度O(N),

int maxsubsequencesum(const int A[],int N){
    int thissum,maxsum,j;
    thissum = maxsum = 0;

    for(j=0; j < N; j++){
        thissum += A[j];
       
        if(thissum > maxsum)
            maxsum = thissum;
        else if(thissum < 0)
            thissum = 0;
    }
    return maxsum;
}

2011年12月14日星期三

Blogger使用SyntaxHighlighter插件及测试

Blogger中,也就是这个博客，使用SyntaxHighlighter来实现语法高亮，需要在模板文件中加入以下语句:

<head>
     <b:include data='blog' name='all-head-content'/>
     <!-- adel zhang 20111214 -->
     <!-- syntaxhighlighter -->
     <script src="http://sites.google.com/site/triadelphous/filestorage/shCore.txt" type="text/javascript">
     <script src='http://sites.google.com/site/triadelphous/filestorage/shBrushCpp.txt' type='text/javascript'/>
     <script src='http://sites.google.com/site/triadelphous/filestorage/shBrushJScript.txt' type='text/javascript'/>
     <script src='http://sites.google.com/site/triadelphous/filestorage/shBrushXml.txt' type='text/javascript'/>
     <script src='http://sites.google.com/site/triadelphous/filestorage/shBrushJava.txt' type='text/javascript'/>
     <script src='http://sites.google.com/site/triadelphous/filestorage/shBrushBash.txt' type='text/javascript'/>
     <script src='http://sites.google.com/site/triadelphous/filestorage/shBrushCss.txt' type='text/javascript'/>
     <link href='http://sites.google.com/site/triadelphous/filestorage/shThemeEmacs.css' rel='stylesheet' type='text/css'/> 
     <script type='text/javascript'>
     SyntaxHighlighter.defaults["quick-code"]=false;
     SyntaxHighlighter.config.bloggerMode = true;
     SyntaxHighlighter.defaults["toolbar"] = false;
     SyntaxHighlighter.all();
     </script>

因为Blogger无法存储外部文件，所以将需要的js文件托管在Google Sites上。至于文件名为什么要改成txt,这是由于有帖子说

But Google Sites, like most free host doesn’t accept javascripts. Luckily there is a workaround -change the javascript file into a text file, by changing the file extension from .js to .txt.

Update:20111217
本来将下载的SyntaxHighlighter托管在Google Sites上，但不知为何链接不到了（上回测试时是可以的）。所以重新修改了模板，使用的是SytaxHighlighter作者提供的pub服务。

<script src='http://alexgorbatchev.com/pub/sh/current/scripts/shCore.js' type='text/javascript'/>
    <script src='http://alexgorbatchev.com/pub/sh/current/scripts/shBrushCpp.js' type='text/javascript'/>
    <script src='http://alexgorbatchev.com/pub/sh/current/scripts/shBrushJScript.js' type='text/javascript'/>
    <script src='http://alexgorbatchev.com/pub/sh/current/scripts/shBrushXml.js' type='text/javascript'/>
    <script src='http://alexgorbatchev.com/pub/sh/current/scripts/shBrushJava.js' type='text/javascript'/>
    <script src='http://alexgorbatchev.com/pub/sh/current/scripts/shBrushBash.js' type='text/javascript'/>
    <script src='http://alexgorbatchev.com/pub/sh/current/scripts/shBrushCss.js' type='text/javascript'/>
    <link href='http://alexgorbatchev.com/pub/sh/current/styles/shThemeEmacs.css' rel='stylesheet' type='text/css'/>

Update: 20120107
遇到的问题是如果代码行太长，则显示时会换行，这样就造成syntaxhighlighter的行号显示出现混乱，极为丑陋。后来发现添加shCore.css这个css后，它会出现滚动条，缓解了行号混乱的问题。但不爽的地方在于会出现竖直滚动条,原因在于shCore.css中对overflow属性使用了visible。所以我们在模板文件中加入下面这些css语句(这些类名是shCore.css里面定义的)，以消除竖直方向上的滚动条。特别注意 !important 的用法，它使得css不是按照通常的定义顺序来使用，而是使用有 !important 的css语句。

/* adel: 20120107
------------- for syntaxhighlighter -----------
------------- get rid of y-sroll --------------*/
.syntaxhighlighter a,
.syntaxhighlighter div,
.syntaxhighlighter code,
.syntaxhighlighter table,
.syntaxhighlighter table td,
.syntaxhighlighter table tr,
.syntaxhighlighter table tbody,
.syntaxhighlighter table thead,
.syntaxhighlighter table caption,
.syntaxhighlighter textarea {
   overflow-y: hidden !important;
}

之前的设置去掉了 toolbar，也就是提示syntaxhighlighter信息的小问号，想想还是加上为好。所以最终的代码为：

<!-- adel zhang 20120107 -->
<!-- syntaxhighlighter -->
<script src='http://alexgorbatchev.com/pub/sh/current/scripts/shCore.js' type='text/javascript'/>
<script src='http://alexgorbatchev.com/pub/sh/current/scripts/shBrushCpp.js' type='text/javascript'/>
<script src='http://alexgorbatchev.com/pub/sh/current/scripts/shBrushJScript.js' type='text/javascript'/>
<script src='http://alexgorbatchev.com/pub/sh/current/scripts/shBrushXml.js' type='text/javascript'/>
<script src='http://alexgorbatchev.com/pub/sh/current/scripts/shBrushJava.js' type='text/javascript'/>
<script src='http://alexgorbatchev.com/pub/sh/current/scripts/shBrushBash.js' type='text/javascript'/>
<script src='http://alexgorbatchev.com/pub/sh/current/scripts/shBrushCss.js' type='text/javascript'/>
<link href='http://alexgorbatchev.com/pub/sh/current/styles/shCore.css' rel='stylesheet' type='text/css'/>
<link href='http://alexgorbatchev.com/pub/sh/current/styles/shThemeEmacs.css' rel='stylesheet' type='text/css'/>
<script type='text/javascript'>SyntaxHighlighter.config.bloggerMode = true;SyntaxHighlighter.all();</script>

2011年12月10日星期六

IPV6下GoAgent的使用

先说FAIL的部分。
今天启动系统的时候，在正常的登陆界面下输入用户名和密码后，就出现花屏，进不去系统。当时第一反应是：完蛋鸟，又得折腾一番，而且很大可能是搞不定然后重装系统，毕竟这不是X就是驱动出问题了，我完全没概念的。
更要命的是我刚把网络通给关了（见下文），也就是说不能求助GOOGLE大神。还好在Grub启动项里有个叫Resume的选项，或许能启动系统。在输入用户名和密码后，果不其然能启动到文字界面，还出现了可疑的出错信息sogouproxy.py。我才想起昨天修改过~/.profile文件，在其中添加执行sogouproxy.py，用于启动搜狗代理服务器。罪魁祸首就是系统启动时当执行用户配置文件时，sogouproxy,py就卡住了，造成X不能正常启动。只能说，学术不精，FAIL!!!

再说说IPV6下GoAgent的使用。
以前介绍过GoAgent，主要是备不时之需（你懂的）。最近校园网络改造，原本寝室可以上教育网，现在只能上校内网络（鸡肋），开通10元的网络通才只能有个教育网出口的国内权限(鸡肋），非得20元的网络通才能有国际权限（抢钱阿）。但神奇的是，即使只有校内权限，但IPV6是不受限制的，所以修改过IPV6 host的google系网站还是可以蹭的。
GoAgent是部署在GAE上的，所以很自然地想是否能通过IPV6连接GoAgent，以此作为IPV4的代理。庆幸的是，GoAgent默认支持IPV6的，只要简单地修改配置文件即可：
在proxy.ini 的 [appspot] 节中有
hosts = cn
修改为:
hosts = ipv6
在 [google]节中，默认使用cn的hosts，注释掉了hk和ipv6的hosts。为了使用ipv6,将cn的hosts注释掉，并去掉ipv6的注释。
重启Goagent，就可以通过ipv6免费上网拉，速度很OK。

2011年12月7日星期三

POJ 1009

复制至此有两个原因：
1. 这题我看完毫无头绪，佩服会解该题的人。
2. 下面的代码写的很干净

原文地址:这里

只需考虑原图中数值变化的点，其他点的编码与其左侧的点相同。
最开始用brute force，优化了输出编码中有连续0的情况，sample input可以较快通过，但提交结果超时。又换成上面的方法，可以AC，但代码改得很乱，待重写。

/*
* 只需考虑原图中数值发生变化的点
*/
#include <stdio.h>
#include <math.h>

typedef struct _Ref {
int index;
int code;
} Ref;

int IN[1000][2];
Ref OUT[8000];

int encode(int n, int width, int total);
int getcode(int n);

void sort(Ref *list, int n);

int
main()
{
int width,i,j,m,n,t,k,cnt,total,current,row,col;
Ref cur;

while(scanf("%d", &width) != EOF) {
if(width == 0)
break;

// input
i = total = 0;
scanf("%d%d", &IN[i][0], &IN[i][1]);
while(IN[i][0] != 0 || IN[i][1] != 0) {
total += IN[i][1];
i++;
scanf("%d%d", &IN[i][0], &IN[i][1]);
}

printf("%d\n", width);

cnt = i;
n = 1;
k = 0;
for(m=0; m<=cnt; m++) {
row = (n - 1) / width;
col = (n - 1) % width;

for(i=row-1; i<=row+1; i++) {
for(j=col-1; j<=col+1; j++) {
t = i * width + j;
if(i<0 || j<0 || j>width-1 || t>total-1)
continue;

OUT[k].index = t + 1;
OUT[k++].code = encode(t+1, width, total);
}
}
n += IN[m][1];
}

sort(OUT, k);

cur = OUT[0];
for(i=0; i<k; i++) {
if(OUT[i].code == cur.code)
continue;

printf("%d %d\n", cur.code, OUT[i].index - cur.index);
cur = OUT[i];
}

printf("%d %d\n", cur.code, total - cur.index + 1);
printf("0 0\n");
}
printf("0\n");

return 0;
}

// 返回第n个元素的编码，n从1开始
int
getcode(int n)
{
int t,i;

i = t = 0;
while(t < n) {
t += IN[i++][1];
}

return IN[i-1][0];
}

// 对第n个元素进行编码，n从1开始
int
encode(int n, int width, int total)
{
int i,j,t,code,result,row,col;

code = getcode(n);

row = (n - 1) / width;
col = (n - 1) % width;

result = 0;
for(i=row-1; i<=row+1; i++) {
for(j=col-1; j<=col+1; j++) {
t = i * width + j;
if(i<0 || j<0 || j>width-1 || t == n-1 || t>total-1)
continue;

if(abs(getcode(t+1) - code) > result)
result = abs(getcode(t+1) - code);
}
}

return result;
}

void sort(Ref *list, int n)
{
Ref tmp;
int i,j;

for(i=0; i<n-1; i++) {
for(j=i+1; j<n; j++) {
if(list[i].index > list[j].index) {
tmp = list[j];
list[j] = list[i];
list[i] = tmp;
}
}
}
}

订阅：博文 (Atom)