华遥的剥壳( • ̀ω•́ )✧

有趣的灵魂终将相遇


  • 首页

  • 标签

  • 分类

  • 归档

  • 搜索

Linux上配置Jupyter Notebook远程访问

发表于 2018-11-05 | 分类于 Jupyter配置 | 阅读次数:

导语:在做大数据量的特征工程以及数据建模的时候,由于个人电脑内存较小,我们往往需要借助于一台内存足够大的Linux服务器。在Linux服务器上配置Jupyter Notebook的远程访问,能够方便我们在本地直接通过浏览器远程使用服务器。

Jupyter Notebook

Jupyter Notebook 的本质是一个 Web 应用程序,便于创建和共享文学化程序文档,支持实时代码,数学方程,可视化和 markdown。 用途包括:数据清理和转换,数值模拟,统计建模,机器学习等等。

Linux上修改Jupyter配置文件

1.生成Jupyter配置文件

$ /root/.jupyter/jupyter_notebook_config.py  #/root/是服务器的根目录

2.生成密码

$ ipython

进入python命令编辑界面

In [1]: from notebook.auth import passwd
In [2]: passwd()
Enter password: #输入你的密码
Verify password: #再次输入你的密码

Out[2]:'sha1:sdjh2yu3h2g27y4efuhf2h' #你的密码生成的哈希值,复制它

3.修改Jupyter默认配置文件

$ gedit /root/.jupyter/jupyter_notebook_config.py

打开之后,修改一下几项,注意去掉前面的注释符号‘#’

c.NotebookApp.ip='*' # '*'表示所有ip都可以访问
c.NotebookApp.password=u'sha1:sdjh2yu3h2g27y4efuhf2h' #粘贴上一步骤中的哈希值
c.NotebookApp.open_browser=False
c.NotebookApp.port=9999 #指定访问的端口号

4.启动Jupyter Notebook

$ Jupyter Notebook

本地访问

打开浏览器,输入 http://服务器ip地址:端口号 即可
如果遇到jupyter SSL Error 问题,则可能是SSL协议不对,改成https即可

FM(Factorization Machine)模型

发表于 2018-10-18 | 分类于 推荐与CTR | 阅读次数:

导语:FM是由Steffen Rendle于2010年提出的一种基于矩阵分解的机器学习模型,解决了CTR预估任务中稀疏数据的特征组合问题,在推荐和计算广告领域中得到广泛应用。本文将从背景、原理以及基于TensorFlow的代码实现三方面详细介绍FM模型。

1.FM的背景

在CTR预估的问题中存在大量的Categorical特征,我们通常的处理方法是对Categorical特征进行one-hot编码处理成0-1的二值特征,以保证不同Categorical特征之间的距离一致。形如:
upload successful
可以看出,特征不同的取值个数决定了one-hot编码之后特征维度,并且其中只有1维特征是1,其余的都是0。所以one-hot编码会使得特征变得高维并且稀疏,很难进行特征组合得到高阶的交叉特征。那为什么要进行特征组合呢?实际上,大量的特征之间存在潜在的关联。举个简单例子,女性用户倾向于点击化妆品、服装类型的物品,而男性用户则倾向于点击运动、电子类的物品,所以相比一阶特征,性别交叉物品种类的二阶特征会对CTR预估有更重要的作用。

阅读全文 »

Hexo+Github配置个人博客

发表于 2017-09-02 | 分类于 Hexo配置 | 阅读次数:

导语:Hexo+Github是利用Hexo框架迅速创建博客网站,并将网站代码托管到GitHub上的一种方式,具有开源、优雅、高效等特点。本文主要记录使用Hexo+Github配置个人博客的过程,包括安装、部署、使用以及美化。

Hexo与GitHub

Hexo 是一个快速、简洁且高效的博客框架。Hexo 使用 Markdown(或其他渲染引擎)解析文章,在几秒内,即可利用靓丽的主题生成静态网页。GitHub的作用类似于网站的服务器,我们将Hexo生成的静态网页部署到GitHub上,GitHub会提供一个username.github.io作为个人博客的地址。

安装Hexo

1.安装Node.js

https://nodejs.org/

2.安装Git

https://git-scm.com/downloads

3.安装Hexo

cmd输入:

$ npm install -g hexo-cli

Hexo建站

1.初始化站点

Git Bash输入:

$ hexo init <folder> //folder为自定义的文件夹名
$ cd <folder>
$ npm install

初始化完成后,根目录的文件如下:

阅读全文 »
华遥

华遥

岁月长 衣裳薄

3 日志
3 分类
© 2017 — 2018 华遥
由 Hexo 强力驱动
|
主题 — NexT.Pisces v5.1.2