SQL函数
SQL 是用于访问和处理数据库的标准的计算机语言。
SQL 是用于访问和处理数据库的标准的计算机语言。
SQL 是用于访问和处理数据库的标准的计算机语言。
SQL 是用于访问和处理数据库的标准的计算机语言。
此文针对数据分析EXCEL部分的入门。
重点是了解各种函数,包括但不限于sum,count,sumif,countif,find,if,left/right,时间转换等。Excel函数不需要学全,重要的是学会搜索。即如何将遇到的问题在搜索引擎上描述清楚。掌握vlookup和数据透视表足够,是最具性价比的两个技巧。
学会vlookup,SQL中的join,Python中的merge很容易理解。
学会数据透视表,SQL中的group,Python中的pivot_table也是同理。
这两个搞定,基本10万条以内的数据统计没啥难度。Excel是熟能生巧,多找练习题。还有需要养成好习惯,不要合并单元格,不要过于花哨。表格按照原始数据(sheet1)、加工数据(sheet2),图表(sheet3)的类型管理。
第三篇数据分析—技巧篇。主要将前两篇的内容以实战方式进行,简单地进行了一次数据分析。数据源采用了真实的爬虫数据,是5000行数据分析师岗位数据。
温馨提示:如果您已经熟悉Excel,大可不必再看这篇文章,或只挑选部分。
此文针对数据分析EXCEL部分的入门。
重点是了解各种函数,包括但不限于sum,count,sumif,countif,find,if,left/right,时间转换等。Excel函数不需要学全,重要的是学会搜索。即如何将遇到的问题在搜索引擎上描述清楚。掌握vlookup和数据透视表足够,是最具性价比的两个技巧。
学会vlookup,SQL中的join,Python中的merge很容易理解。
学会数据透视表,SQL中的group,Python中的pivot_table也是同理。
这两个搞定,基本10万条以内的数据统计没啥难度。Excel是熟能生巧,多找练习题。还有需要养成好习惯,不要合并单元格,不要过于花哨。表格按照原始数据(sheet1)、加工数据(sheet2),图表(sheet3)的类型管理。
第二篇数据分析—技巧篇。主要简单讲解很有性价比的功能,提高工作效率。
温馨提示:如果您已经熟悉Excel,大可不必再看这篇文章,或只挑选部分。
此文针对数据分析EXCEL部分的入门。
重点是了解各种函数,包括但不限于sum,count,sumif,countif,find,if,left/right,时间转换等。Excel函数不需要学全,重要的是学会搜索。即如何将遇到的问题在搜索引擎上描述清楚。掌握vlookup和数据透视表足够,是最具性价比的两个技巧。
学会vlookup,SQL中的join,Python中的merge很容易理解。
学会数据透视表,SQL中的group,Python中的pivot_table也是同理。
这两个搞定,基本10万条以内的数据统计没啥难度。Excel是熟能生巧,多找练习题。还有需要养成好习惯,不要合并单元格,不要过于花哨。表格按照原始数据(sheet1)、加工数据(sheet2),图表(sheet3)的类型管理。
第一篇数据分析—函数篇。主要简单讲解常用的函数,以及与之对应的SQL/Python函数。
温馨提示:如果您已经熟悉Excel,大可不必再看这篇文章,或只挑选部分。
1 | 1 G = 1024^3 |
1个整数占4个字节,1个字节为8位二进制(1个字节能表示2^8=256个数字范围,大小可以从-2^7-1~2^7),因此1个整数为32位二进制(1个整数表示2^32个数字范围)
8进制必须以0开头,16进制数必须以0x开头。
使用ASCII编码,可以将一个字节Byte转换成一个字符Character。数据类型的长度跟编译器和系统有关。
在Windows下32位编译器的数据类型字节数:1
2
3
4
5
6
7
8
9
10char:1个字节
char\*(即指针变量):4个字节(32位的寻址空间是2^32,即32个bit,也就是4个字节。)
short int:2个字节
int:4个字节
unsigned int:4个字节
float:4个字节
double:8个字节
long:4个字节
long long:8个字节
unsigned long:4个字节
在Windows下64位编译器的数据类型字节数:1
2
3
4
5
6
7
8
9
10char:1个字节
char\*(即指针变量):8个字节(64位的寻址空间是2^64,即64个bit,也就是8个字节。)
short int:2个字节
int:4个字节
unsigned int:4个字节
float:4个字节
double:8个字节
long:4个字节
long long:8个字节
unsigned long:4个字节
但如果是linux系统的话,在64位编译器下long和unsigned long类型将变成8个字节。
| 编码 | 大小 | 支持语言 |
|---|---|---|
| ASCII | 1个字节 | 英文 |
| Unicode | 2个字节(生僻字4个) | 所有语言 |
| UTF-8 | 1-6个字节,英文字母1个字节,汉字3个字节,生僻字4-6个字节 | 所有语言 |
最早只有127个字母被编码到计算机里,也就是大小写英文字母、数字和一些符号,这个编码表被称为ASCII编码,比如大写字母A的编码是65,小写字母z的编码是122。
但是要处理中文显然一个字节是不够的,至少需要两个字节,而且还不能和ASCII编码冲突,所以,中国制定了GB2312编码,用来把中文编进去。
你可以想得到的是,全世界有上百种语言,日本把日文编到Shift_JIS里,韩国把韩文编到Euc-kr里,各国有各国的标准,就会不可避免地出现冲突,结果就是,在多语言混合的文本中,显示出来会有乱码。
因此,Unicode应运而生。Unicode把所有语言都统一到一套编码里,这样就不会再有乱码问题了。
Unicode标准也在不断发展,但最常用的是用两个字节表示一个字符(如果要用到非常偏僻的字符,就需要4个字节)。现代操作系统和大多数编程语言都直接支持Unicode。
新的问题又出现了:如果统一成Unicode编码,乱码问题从此消失了。但是,如果你写的文本基本上全部是英文的话,用Unicode编码比ASCII编码需要多一倍的存储空间,在存储和传输上就十分不划算。
所以,本着节约的精神,又出现了把Unicode编码转化为“可变长编码”的UTF-8编码。UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节,常用的英文字母被编码成1个字节,汉字通常是3个字节,只有很生僻的字符才会被编码成4-6个字节。如果你要传输的文本包含大量英文字符,用UTF-8编码就能节省空间。
UTF-8编码有一个额外的好处,就是ASCII编码实际上可以被看成是UTF-8编码的一部分,所以,大量只支持ASCII编码的历史遗留软件可以在UTF-8编码下继续工作。
这是部署了的我的博客:RP’s Blog可以点击预览效果
在多说 进行注册,我用的是我的QQ号,获取通用代码。
将通用代码粘贴到 \themes\light\layout\_partial\comment.ejs 里边,
其中var duoshuoQuery = {short_name:"paradoxallen"}里的paradoxallen是我的账号。
如下:1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32<% if (page.comments){ %>
<nav id="pagination" >
<% if (page.prev) { %>
<a href="<%- config.root %><%- page.prev.path %>" class="alignleft prev" ><%= __('prev') %></a>
<% } %>
<% if (page.next) { %>
<a href="<%- config.root %><%- page.next.path %>" class="alignright next" ><%= __('next') %></a>
<% } %>
<div class="clearfix"></div>
</nav>
<!-- 多说评论框 start -->
<div class="ds-thread" data-thread-key="<%- config.root %><%- item.path%>" data-title="<%- item.title %>" data-url="<%- item.permalink %>"></div>
<!-- 多说评论框 end -->
<!-- 多说公共JS代码 start (一个网页只需插入一次) -->
<script type="text/javascript">
var duoshuoQuery = {short_name:"paradoxallen"};
(function() {
var ds = document.createElement('script');
ds.type = 'text/javascript';ds.async = true;
ds.src = (document.location.protocol == 'https:' ? 'https:' : 'http:') + '//static.duoshuo.com/embed.js';
ds.charset = 'UTF-8';
(document.getElementsByTagName('head')[0]
|| document.getElementsByTagName('body')[0]).appendChild(ds);
})();
</script>
<!-- 多说公共JS代码 end -->
<section id="comment">
</section>
<% } %>
在themes/light/layout/_partial/head.ejs里将<link href="<%- config.root %>favicon.png" rel="icon">
替换为<link href="<%- config.root %>favicon.ico" rel="icon" type="image/x-ico">将favicon.ico图标文件放在source目录下。
很简单,在themes/light/_config.yml中,添加如下:1
2
3
4
5
6
7widgets:
- category
- tagcloud
```
### 添加友情链接widget ###
在`themes/light/layout/_widget`中新建名为`blogroll.ejs`的文件,编辑内容如下:
1 |
|
widgets: #站点右边栏,暂时默认,后面介绍修改和添加
1 |
|
menu: #站点右上角导航栏,暂时默认
首页: /
归档: /archives
关于: /about
widgets: #站点右边栏
excerpt_link: 阅读全文 #替换为中文
plugins:
twitter: #右边栏要显示twitter展示的话,需要在此设置
username:
show_replies: false
tweet_count: 5
addthis: #SNS分享,身在天朝,当然用“百度分享”,暂时默认
enable: true
pubid:
facebook: true
twitter: true
google: true
pinterest: true
fancybox: true #图片效果,默认
google_analytics: #要使用google_analytics进行统计的话,这里需要配置ID
rss: /atom.xml #生成RSS,需要配置路径1
2
### 根目录下的_config.yml文件设置 ###
title: RP’s Blog
subtitle:
description: 学习总结 思考感悟 # 网站描述
author: paradox
email: paradoxallen@gmail.com
language: zh-CN
url: http://paradoxallen.github.io
root: /
permalink: :year/:month/:day/:title/
tag_dir: tags
archive_dir: archives
category_dir: categories
code_dir: downloads/code
permalink_defaults:
source_dir: source
public_dir: public
new_post_name: :title.md # File name of new posts
default_layout: post
titlecase: false # Transform title into titlecase
external_link: true # Open external links in new tab
filename_case: 0
render_drafts: false
post_asset_folder: false
relative_link: false
highlight:
enable: true
line_number: true
tab_replace:
default_category: uncategorized
category_map:
tag_map:
archive: 1
category: 1
tag: 1
port: 4000
server_ip: localhost
logger: false
logger_format: dev
date_format: YYYY-MM-D
time_format: H:mm:ss
per_page: 5 #每页5篇文章
pagination_dir: page
disqus_shortname:
theme: light
exclude_generator:
deploy:
type: github
repository: git@github.com:paradoxallen/paradoxallen.github.io.git
branch: master1
2
3
4
5
6
### 添加RSS ###
hexo提供了RSS的生成插件,需要手动安装和设置。步骤如下:
安装RSS插件到本地:`npm install hexo-generator-feed`
开启RSS功能:编辑`hexo/_config.yml`,添加如下代码:
plugins:
1 | 在站点添加链接: |
<%
if(page.layout !== ‘false’){
%>
<%- partial(‘_partial/head’) %>
<%}else{ %>