路上

Matlab 与 Excel 混合编程

作者: lushang
时间: 2015-08-02
分类: Data,Coding
评论

Matlab与Excel混合编程其实早在2010年科学网左正伟博客就有一篇文章总结了，到现在（2015年）也不为过时。这里在简要引用一下，作者终结了四种（当时）主流的实现方式：

利用Excel Link（最常用方法），具体参见Matlab帮助或Excel Link手册。
利用Excel生成器(Matlab作COM服务器)
利用Active X控制(Matlab作COM客户端)
文件导入方法(利用xlsread和xlswrite函数读写Excel文件)

路上这篇文章主要介绍最后一种方法，即利用xlsread和xlswrite函数去读写Excel文件，再用Matlab进行数据处理的思路。因为路上的需求非常简单（粗暴）：统计一堆按照某种格式制作的Excel文件（工作簿）中每个工作表（工作表/Worksheet）中指定位置的内容，并返回统计结构。
Matlab去满足这两种需求也很简单：利用xlsread读取内容，处理后，利用xlswrite写入预定格式的Excel文件中。其中xlsread用的函数调用方法为：

[num,txt,raw] = xlsread(filename,sheet,xlRange)

而xlswrite的调用方法为：

xlswrite(filename,A,sheet,xlRange)

同时我们使用

[satus,sheets] = xlsfinfo(filename)

得到每个工作表（worksheet）的名称，同时我们也可以通过numel(sheets)获得工作表数量信息。而为了去自动读取所有的Excel文件，我们将所有要处理的文件放在一个文件夹下，然后利用 file = dir('./*.xlsx') 命令将所有Excel文件存入一个结构数组中。

思路（步骤）总结

利用 dir 函数读取所有要处理的Excel文件信息
利用xlsfinfo函数获得Exce文件中的工作表（worksheet）信息（名称、数量等）
利用xlsread函数读取Excel文件中指定工作表（worksheet）指定位置数据
Matlab 编程处理数据
利用xlswrite 函数将相关数据以存入预定格式的 Excel 文件中

Discuz！3.2 邮箱32位限制的解除方法

作者: lushang
时间: 2015-07-28
分类: 网站后端,Hack
评论

Discuz！是非常知名的论坛和门户建站平台。但是其对电子邮箱有32位的限制，任何超过32位的邮箱都会被判断为无效邮箱。但是，实际上现在会有一些邮箱会超过这一限制，因此本着对所有用户负责人的态度，解除这一限制就成了当务之急。

经过粗略的研究Discuz！的form有效性验证是form内容提交到网站后，后台（php语言部分）进行验证，再将结果通过Ajax（注册时采用）或者召唤相应页面（注册后手动修改邮箱时采用）的方式返回到网页前端。同时，通过对3.2版本的Discuz！数据库研究发现，其默认的邮箱字段长度位255为可变字符（varchar）。因此，只要我们修改后台相应的php验证模块，我们可以实现最长255位的邮箱支持。不过实际上很难有人注册这种邮箱，我们的目标是为正常人类服务，因此将邮箱长度设置为64位.下面是步骤，就两步：

修改注册流程的后台php验证代码：
修改\discuz\source\function\function_core.php第370行函数「isemail」中最大长度32为64
修改手动修改邮箱流程的后台php验证代码：
修改\discuz\source\function\function_member.php第285行函数「checkemail($email)」中「strlen($email) > 32」为「strlen($email) > 64」.

使用 Python 轻松抓取网页

作者: lushang
时间: 2015-05-29
分类: Data,Coding
评论

注：文章基于python3，路上通过这篇文章中的内容，写了20多行代码，实现定时抓取某网页某几个数据的目标

准备工作

要使用python抓取网页，可以使用两个包：requests用于下载网页，而BeautifulSoup则对网页进行结构化解析。如果你在电脑上安装了pip，则可以使用下面的命令下载安装这两个包：

pip install requests beautifulsoup4

或者按照引用文章1将两个包安装到虚拟环境。
（实际上路上通过分析发现，在路上的需求里，第二个包没有用到。。）

抓取网页

抓取网页及其简单，假如我要抓取「https://pip.pypa.io/en/stable/」这个网页，则使用：

import requests
response = requests.get(‘https://pip.pypa.io/en/stable/')

在函数返回后，就能从response.text中获得这个页面的文本数据（html或者其他文本）。

抓取数据后，使用BeautifulSoup对文本数据处理，便会得结构化的HTML，然后就可以利用BeautifulSoup强大的HTML处理能力抓取相关内容了。但是路上经过分析发现需要抓取的内容位于某xx.js文件内，是json变量。所以BeautifulSoup没能使用的上。。

使用python处理JSON内容

python原生支持JSON，使用json.loads(JSONdata)将JSON转换为xml，然后使用xml相关技术得到相关数据。具体步骤略去。
python处理JSON可以参见这篇文章。

php中array_push的用法和注意事项

作者: lushang
时间: 2015-05-12
分类: Coding,网站后端
评论

array_push用法

将一个或多个单元压入数组的末尾（入栈）
array_push() 将 array 当成一个栈，并将传入的变量压入 array 的末尾。array 的长度将根据入栈变量的数目增加。
这里是php.net上的更多内容。

array_push注意事项

如果用 array_push() 来给数组增加一个单元，还不如用 $arrayXX[] = $dataXX，因为这样没有调用函数的额外负担。
对于关联数组的push，使用$data[$key] = $value;会更加方便

用D3.js实现基于SVG的线形图

作者: lushang
时间: 2015-04-27
分类: 网站前端,Coding,网站后端
评论

参考文章：用D3.js实现基于SVG的线形图

不同之处：数据使用php的json_encode函数一JSON数组的格式输出到js变量；然后作为参数输入相应的绘图函数。

TODO：修改完善这篇文章
加入多条折线图！