存档

‘互联网技术’ 分类的存档

htmlcleaner 使用说明

2014年12月22日 3 条评论

说明

在编程的时候或者写网络爬虫的时候,经常需要对html进行解析,抽取其中有用的数据。一款好的工具是特别有用的,能提供很多的帮助,网上有很多这样的工具,比如:htmlcleaner、htmlparser
经使用比较:感觉 htmlcleaner 比 htmlparser 好用,尤其是htmlcleaner 的 xpath特好用。
htmlcleaner 下载地址:htmlcleaner2_1.jar 源码下载:htmlcleaner2_1-all.zip
下面针对htmlcleaner进行举例说明,需求为:取出title,name=”my_href” 的链接,div的class=”d_1″下的所有li内容。

阅读全文…

论百度 谷歌 dz等广告联盟

2013年6月25日 没有评论

背景

时至当日,广告联盟如雨后春笋一般多如牛毛。曾几何时最好申请的谷歌现在也变的很难申请,加入了许多条条框框,使很多小站长进不了门。广告联盟数量越多,问题也就越多,我们国内站长大部分都是靠广告联盟养活,当然,国内部分大型门户网站也挂了百度、搜狗等广告联盟。今天我们就广告联盟的申请、规模、盈利、广告匹配等方面说说我们众所周知的广告联盟,当然这些都是我知道的,如果我不知道的也欢迎各位补充。

申请广告联盟

这个大家都比较清楚了吧?很少还有人不知道的,当然,还是有很多新手不知道的。下面来讲讲各个广告联盟的申请难度吧,具体申请方案自己搜索去,网上一大把。
1.谷歌联盟:
这货无疑是最好的联盟,从收入到匹配完全秒杀其他广告联盟,但是从08年开始好像,具体时间不记得了。谷歌联盟的帐户申请难度直线增加,什么域名注册半年以上拉,什么什么的,反正是很难了。
2.百度联盟:
这货算是比较规矩的,有个备案号,网站多少有点访问量,文章量多点,收录多点,然后就可以申请下来了。当然,没有备案号也可以申请下来,比如小可博客就是在未申请备案号的情况下申请成功的。个人感觉,网站的分类一定要选择正确,选个最贴切的来申请,一般也都能过。
3.dz联盟:
这货是新开的,反正我是刚知道的。申请比较好申请,有备案号就可以下来。
4.搜狗联盟:
我直接不想说了,这货不给我下号,我申请了好几次,说小可博客质量和内容不够完善,OO那个XX的。

阅读全文…

Google App Engine java版教程2-安装Java SDK

2013年6月15日 没有评论

安装 Java SDK

您可以使用 App Engine Java 软件开发工具包 (SDK) 为 Google App Engine 开发和上传 Java 应用程序。

SDK 包含网络服务器软件,您可以在自己的计算机上运行该软件以测试 Java 应用程序。服务器模拟所有 App Engine 服务,包括本地版本的数据存储区、Google 帐户以及使用 App Engine API 从计算机中提取网址和发送电子邮件的功能。

获取 Java

Google App Engine 支持 Java 5 和 Java 6。在 App Engine 上运行 Java 应用程序时,将使用 Java 6 虚拟机 (JVM) 和标准库运行该应用程序。理想情况下,您应使用 Java 6 编译和测试应用程序,以确保本地服务器的工作方式与 App Engine 类似。

App Engine SDK 与 Java 5 兼容,这非常适用于不能方便获取 Java 6 的开发人员(如使用 Mac OS X 的开发人员)。您可以将使用 Java 5 编译的类和 JAR 上传到 App Engine。

如有必要,请下载并安装适合您的平台的 Java SE 开发工具包 (JDK)。苹果机用户可以访问 Apple Java 开发人员网站,以下载并安装用于 Mac OS X 的 Java 开发人员工具包的最新版本。

在安装 JDK 后,请从命令提示符(Windows 为命令提示符;Mac OS X 为终端)中运行以下命令,以验证您是否能够运行这些命令以及确定安装的版本。如果安装了 Java 6,这些命令将报告类似于 1.6.0 的版本号。如果安装了 Java 5,则版本号与 1.5.0 类似。

java -version
javac -version

阅读全文…

Google App Engine java版中文教程1-简介

2013年6月15日 没有评论

Google App Engine简介

欢迎使用 Google App Engine!创建 App Engine 应用程序的过程非常简单,只需几分钟时间,而且可以免费开始使用:立即上传您的应用程序并将其与用户共享,不需要支付费用也不需要承担义务。

Google App Engine 应用程序可以使用 Java 或 Python 编程语言编写。本教程介绍的是 Java。如果您更喜欢使用 Python 构建应用程序,请参阅使用入门:Python

在本教程中,您将学习如何完成以下操作:

使用标准 Java 网络技术(如 Servlet 和 JSP)构建 App Engine 应用程序
使用或不使用 Eclipse 创建 App Engine Java 项目
使用用于 Eclipse 的 Google 插件进行 App Engine 开发
将 App Engine 数据存储区与 Java 数据对象 (JDO) 标准接口一起使用
将 App Engine 应用程序与 Google 帐户集成以进行用户身份验证
将应用程序上传到 App Engine
在本教程结束前,您将实现一个可运行的应用程序 – 可让用户将消息发布到公共留言板的简单留言簿。

下一步…

要开始开发 Google App Engine Java 应用程序,请下载并安装 App Engine Java 软件开发工具包和相关组件。

转至安装 Java SDK

网站如何集成支付宝支付接口

2013年5月16日 1 条评论

申请条件

支付宝集成条件:集成网站必须有自己的网站域名。

申请流程

网站集成支付宝支付接口的流程1
1、登录网站https://www.alipay.com,选择商家服务
网站集成支付宝支付接口的流程2
阅读全文…

JS/CSS压缩工具

2013年5月11日 1 条评论

谷歌JS压缩工具 Closure Compiler Application

1、下载地址:http://closure-compiler.googlecode.com/files/compiler-latest.zip
2、使用方法:
把解压到的compiler.jar放到一个文件夹下比如放在d盘文件夹名为js_dir 创建一个hello.js放在同目录下,然后cmd操作命令如下
java -jar compiler.jar –js hello.js –js_output_file hello-compiled.js
当然要先使用d: cd is_dir 进入文件夹.
生成的 hello-compiled.js就是我们的想要的文件,可能程序在cmd 框会输出warnning和可能出现bug的地方,及时修改掉就OK了.当然这只是简单模式simple还有高级模式.
线上使用地址:http://closure-compiler.appsp0t.com/home

雅虎JS/CSS压缩工具 YUI Compressor

下载地址:http://yuilibrary.com/download/yuicompressor
使用方法方法与谷歌的相同,命令有点不同
java -jar yuicompressor-2.4.7.jar –type css –charset utf-8 -o dest.css src.css
–type 类型js/css
–charset 编码
dest.css目标文件
src.css源文件

个人觉得谷歌js压缩比雅虎的效率要高一点,css压缩只有用雅虎了,因为谷歌还没出来.

百度网盟贴片推广使用说明

2013年4月22日 没有评论

贴片推广介绍

今天在看百度网盟帮助文档的时候,看到一个词”贴片推广”,当时没有明白啥意思,随后在网上查了一些贴片推广的资料,和大家分享下。
贴片推广是通常在视频播放前或在线游戏加载时展现推广信息的一种推广方式,多见于小游戏类、视频影视类站点及一些视频点播软件。下面详细介绍百度网盟贴片推广产品.

百度网盟贴片推广的优点

收益高:贴片推广较特殊的展示时间点使其对受众具有一定强制性,且展示在高关注区域,能很好的抓住眼球,获得高点击率。点击率高,收益自然就高。同时,广告主十分青睐贴片推广这种推广形式,愿意为此付出更高的推广费用。
体验好:贴片推广在受众进行主要活动如看电影、玩游戏时并不进行展示。没有额外的打扰,网民的接受度很高。

阅读全文…

高性能计算集群

2013年4月14日 没有评论

高性能计算集群简介

      就像冗余部件可以使你免于硬件故障一样,群集技术则可以使你免于整个系统的瘫痪以及操作系统和应用层次的故障。一台服务器集群包含多台拥有共享数据存储空 间的服务器,各服务器之间通过内部局域网进行互相连接;当其中一台服务器发生故障时,它所运行的应用程序将与之相连的服务器自动接管;在大多数情况下,集 群中所有的计算机都拥有一个共同的名称,集群系统内任意一台服务器都可被所有的网络用户所使用。一般而言,群集和高可用性结合的服务器可将运行提升至 99.99%。群集技术不仅仅能够提供更长的运行时间,它在尽可能地减少与既定停机有关的停机时间方面同样有着重要意义。例如,如果使用群集,你可以在关 闭一台服务器的同时,不用与用户断开即可进行应用,硬件,操作系统的”流动升级”。集群系统通过功能整合和故障过渡技术实现系统的高可用性和高可靠性,集 群技术还能够提供相对低廉的总体拥有成本和强大灵活的系统扩充能力。
      随着计算机技术的发展和越来越广泛的应用,越来越多的依赖于计算机技术的应用系统走进了我们的工作和生活。在给我们带来方便和效率的同时,也使得各行各业 对于计算机技术的依赖程度越来越高。尽管随着计算机技术以日新月异的速度发展,单台计算机的性能和可靠性越来越好,但还是有许多现实的要求是单台计算机难 以达到的。
高可用性集群,英文原文为High Availability Cluster, 简称HA Cluster,是指以减少服务中断(宕机)时间为目的的服务器集群技术。
      随着全球经济的增长,世界各地各种各样的组织对IT系统的依赖都在不断增加,电子贸易使得商务一周七天24小时不间断的进行成为了可能。新的强大的应用程 序使得商业和社会机构对日常操作的计算机化要求达到了空前的程度,趋势非常明显,我们无时无刻不依赖于稳定的计算机系统。
      这种需求极速的增长,使得对系统可用性的要求变得非常重要,许多公司和组织的业务在很大程度上都依赖于计算机系统,任何的宕机都会造成严重的损失,关键 IT系统的故障可能很快造成整个商业运作的瘫痪,每一分钟的宕机都意味着收入、生产和利润的损失,甚至于市场地位的削弱。

通过日志分析搜索引擎蜘蛛爬虫的行为

2013年3月24日 没有评论

简要说明

做好百度和谷歌优化的第一步就是蜘蛛的抓取,下面的Linux命令可以让你清楚的知道蜘蛛的爬行情况。这里请首先看看日志大小,如果很大(超过50M)建议别用这些命令分析,因为这些命令很消耗CPU,或者抓下来放到分析机上执行,以免影响网站的速度。这些命令都是Linux下的shell命令,在/var/log/apache2/下面可以找到日志文件。access.log这个文件记录的应该是最近一天的日志情况。

阅读全文…

QueryDSL 类型安全的查询框架

2013年1月5日 没有评论

QueryDSL介绍

       QueryDSL仅仅是一个通用的查询框架,专注于通过Java API构建类型安全的SQL查询。
       Querydsl可以通过一组通用的查询API为用户构建出适合不同类型ORM框架或者是SQL的查询语句,也就是说QueryDSL是基于各种ORM框架以及SQL之上的一个通用的查询框架。
       借助QueryDSL可以在任何支持的ORM框架或者SQL平台上以一种通用的API方式来构建查询。目前QueryDSL支持的平台包括JPA,JDO,SQL,Java Collections,RDF,Lucene,Hibernate Search。

JPA的例子

List<Customer> result = query.from(customer)
    .where(customer.lastName.like("A%"), customer.active.eq(true))
    .orderBy(customer.lastName.asc(), customer.firstName.desc())
    .list(customer);