HTMLParser好像不是个很好的解决方案吧,他本来就有很多缺陷,而且他也是基于正则匹配的。你还不如自己写个正则匹配去匹配所有input,type是hidden的。要么就用Beautiful Soup,这个也不用安装,直接用就可以了。
python里有一个sgmlparser是htmlparser的父类。应该能够满足的你的基本需求。我以前在这个sgmlparser基础上,做了一个html的畸形校正器。