kba977の空想庭院
kba977の空想庭院


  • 首页

  • 归档

  • 分类

  • 标签

  • 关于

  • 搜索

Crontab定时任务

发表于 2016-07-15 | 分类于 工具 | | 阅读次数

通过crontab 命令,我们可以在固定的间隔时间执行指定的系统指令或 shell script脚本。时间间隔的单位可以是分钟、小时、日、月、周及以上的任意组合。这个命令非常适合周期性的日志分析或数据备份等工作。

1. crontab的文件格式

分 时 日 月 星期 要运行的命令

第1列分钟1~59
第2列小时1~23(0表示子夜)
第3列日1~31
第4列月1~12
第5列星期0~6(0表示星期天)
第6列要运行的命令

例如, 表示每过三小时执行一次 sh /tmp/command.sh 命令:

0 */3 * * * sh /tmp/command.sh
阅读全文 »

NetCat学习笔记

发表于 2016-07-14 | 分类于 工具 | | 阅读次数

NetCat,在网络工具中有“瑞士军刀”美誉,其有Windows和Linux的版本。因为它短小精悍(1.84版本也不过25k,旧版本或缩减版甚至更小)、功能实用,被设计为一个简单、可靠的网络工具,可通过TCP或UDP协议传输读写数据。同时,它还是一个网络应用Debug分析器,因为它可以根据需要创建各种不同类型的网络连接。

版本参数简介

语 法: nc [-hlnruz][-g<网关...>][-G<指向器数目>][-i<延迟秒数>][-o<输出文件>][-p<通信端口>][-s<来源地址>][-v...][-w<超时秒数>][主机名称][通信端口...]

补充说明:执行本指令可设置路由器的相关参数。

阅读全文 »

Scrapy爬虫系列之一个整站爬取

发表于 2016-06-09 | 分类于 Scrapy爬虫系列 | | 阅读次数

本节是Scrapy系列中的一节, 主要是多页面, 多Item和 图片下载功能的爬取。

本次我们要爬取的站是我个人非常喜欢的一个站点, 即韩寒的一个, 每天会更新一张图片, 一句话, 一篇文章和一个问答, 页面十分简洁。如下图所示:

阅读全文 »

Python数据可视化

发表于 2016-05-25 | 分类于 Python | | 阅读次数

基础

用python的matplotlib模块画最简单的折线图, 及在图中添加文字和图例

1
2
3
4
5
import matplotlib.pyplot as plt

plt.plot([1,3,2,4])
plt.ylabel('some number')
plt.show()

阅读全文 »

并发爬取百度贴吧

发表于 2016-05-22 | 分类于 Python | | 阅读次数

撰写本文目的在于学习python的几个模块和多线程的一些知识
用到的python知识有:

  • requests
  • lxml
  • xpath (严格来不该成为模块, 是一种提取数据的方法)
  • multiprocess.dummy, Pool, 线程池
  • map 函数
阅读全文 »
1234…6
kba977

kba977

什么都略懂一点, 生活更精彩一些

30 日志
7 分类
18 标签
Facebook Twitter Github Weibo Email
友情链接
  • MacTalk
  • 兔兔西的Blog
  • 夜殇的小站
  • Thinking Realm
© 2015 - 2021 kba977
由 Hexo 强力驱动
主题 - NexT.Muse