Tag:

图表数据库 – 投注公司呢?

看看Neo4j,320亿的关系限制让我感到担忧(假设有4000万用户上传了500张照片,500个朋友,500条评论等,而在你知道之前你已经超过了320亿)。必须确保我正在使用哪个数据库做出最佳select。 不寻找主观的答案,也没有在这里辩论 – 即。 哪一个更好,等等 – 相反,因为我在图表数据库的使用上打赌一个创业公司的未来 ,所以我需要知道不同数据库存在的风险,比如Neo4j没有超过320亿的关系。 现在,有几家公司把他们的graphics数据库称为“领先的graphics数据库”。但让我们来看看过去的炒作 – 哪一个最有经济支持? 哪个数据库享有较大的社区支持? 哪一个公司背后有一个坚实的公司来支持商业? 哪一个最有可能是足够成熟,所以如果你想,你可以轻松地创buildFacebook的最小努力? select技术特性或熟悉度的graphics数据库是很容易的 – 但是我正在寻找更多的东西 – 我想确保公司的几年时间还在。 我想确保我不会select与Neo4j基于炒作和它目前(暂时?)的势头… … 还有什么其他的图表可以与Neo4gj竞争,创造一个类似Facebook的完整的社交networking(再次, 不寻找更好的 ,只是寻找一个坚实的竞争对手)。 请不要让这变成一个主观的Neo vs Dex辩论 – 只是事实和固体的答案,请..

如何在MATLAB中绘制没有黑边的曲面图?

黑线是可怕的,我怎么能摆脱它们? 我只想要彩色的表面。

像LinkedIn这样的网站如何有效地在每个人的姓名旁边显示1/2/3级关系?

我最近通过回答一个简单的问题来糟糕的回答了一个面试问题:像LinkedIn这样的网站如何有效地向您显示每个在网页上显示的人的关系距离(第一/第二/第三)(例如,在人员search结果,工作人员列表在一家公司等)? 我得到了解决scheme的基本“技巧”:find“距离我”是一个常见的操作(例如,在一个页面上20x +,每个login会话100个),所以你可以做一部分“距离我X“,将其caching,然后多次重复使用该caching的部分结果,以使其他操作更便宜。 我也猜测,部分结果很可能是我的二级连接,因为“caching所有三级连接”在RAM和CPU中的成本太高。 </ EDIT> 但是,当试图将这种见解转化为解决scheme时,我想出了一个令人尴尬的答案,涉及到创build持久的caching,这个caching是网站上每个人的二级连接(这将会非常昂贵,而且维护复杂)莫名其妙地绕过布鲁姆filter ,这种方式几乎没有技术意义。 我不会在这样的答案之后雇用自己的! 后来,当我在没有面试压力的情况下思考这个问题时,我想出了一个更合理的答案。 build立一个非常快速的方式来获得每批用户ID的第一级连接(批量大小可达〜1000?)。 这可能意味着一个RAM专用服务器集群,它可以将整个networking的第一级连接caching在内存中。 幸运的是,有五千万会员x平均。 每个成员100个连接x每个成员4个字节ID = <25GBcaching在RAM中,这可以通过合理定价的硬件来实现。 而且每天的变化数量将在1%以下,所以保持caching最新不是太难。 (请注意,关系数据库可能是一个不好的select来实现这个caching,因为“大量的随机I / O”访问模式杀死了关系数据库的性能。) 当用户login时,通过获取每个第一级连接的第一级连接来caching他的第二级连接,并且使用散列表(键=第二级ID,值=连接你的第一级连接的数组) 。 同样caching你的第一级连接,这样你就可以通过一次调用将你的第一级和第二级拉回远程caching服务器。 用户ID很容易分区,所以像memcached这样的分布式caching可能会很好地工作。 对于任何用户ID,要查找它是否在您的“networking”中,以及它与您(第一,第二,第三)有什么关系,请执行以下操作: 如果ID在您的一级连接中,请停止。 试着在你的caching二级连接哈希表中查找ID。 如果find,返回连接你的连接数组。 获取ID的第一级连接,并为它们中的每一个重复步骤#2。 将所有结果汇总到一个数组中并返回。 (EDIT)重构为一个批处理实现(“从我到N个不同的用户查找距离”),所以你可以从步骤#3获得所有的远程结果,而不必弥补N个远程调用。 </ EDIT> 但我相信有更好的答案。 你的是啥呢? 如果你想要额外的挑战,试着模拟一个inteview的情况(不能在网上查找解决scheme)。 请注意,这个问题是关于一个最佳的解决scheme,无论LinkedIn今天是如何实际做到的 ,在我写上自己的答案之后,我看了一下。

如何使用knitr导入本地图像进行降价

我有一个本地目录中的外部创build的PNG图像,我想用knitr导入到一个报告。 最终目标文件types是html。 当我用R代码创build自己的数字时,我没有任何问题,但是我不知道该怎么想是一个简单的问题。 当我在这,我怎么会导入一个我有一个url的数字?

如何在Python中制作3D散点图?

我目前有一个nx3matrix数组。 我想把三列画成三个轴。 我怎样才能做到这一点? 我已经search了,并且有人build议使用Matlab ,但是我真的很难理解它。 我也需要它是一个散点图。 有人可以教我吗?

如何在Matlab中绘制2D FFT?

我正在使用fft2在MATLAB中计算灰度图像的傅立叶变换。 绘制结果大小的常用方法是什么?

python:使用matplotlib使用字典绘制一个栏

有没有什么办法用matplotlib直接从字典中使用数据绘制条形图? 我的字典看起来像这样: D = {u'Label1':26, u'Label2': 17, u'Label3':30} 我期待着 fig = plt.figure(figsize=(5.5,3),dpi=300) ax = fig.add_subplot(111) bar = ax.bar(D,range(1,len(D)+1,1),0.5) 去工作,但事实并非如此。 这是错误: >>> ax.bar(D,range(1,len(D)+1,1),0.5) Traceback (most recent call last): File "<stdin>", line 1, in <module> File "/usr/local/lib/python2.7/site-packages/matplotlib/axes.py", line 4904, in bar self.add_patch(r) File "/usr/local/lib/python2.7/site-packages/matplotlib/axes.py", line 1570, in add_patch self._update_patch_limits(p) File "/usr/local/lib/python2.7/site-packages/matplotlib/axes.py", line 1588, in _update_patch_limits xys = […]

R的不一致性:为什么add = T有时会起作用,有时不在plot()函数中?

为什么R与plot()函数中的add参数不一致? 它有时有效,有时不起作用! 在这个例子中,参数add=TRUE没有问题: plot(0:10, 0:10*3) plot(identity, add=TRUE, xlim=c(0,10)) plot(function (x) { sin(x)*10 }, add=TRUE, xlim=c(0,10)) 但是当我问题 plot(c(2, 3, 4), c(20,10,15), add=TRUE, pch="A") 它不工作! 它说“添加”不是一个graphics参数。 请不要写我应该使用points()来代替。 我知道我可以使用它。 我想了解R的奇怪行为 – 为什么它有时会起作用,有时候不行?

在iPython或iPython Notebook中显示可旋转的3D图

(Mac OSX 10.10.5) 我可以从matplotlib网站http://matplotlib.org/gallery.html#mplot3d复制三维散点图的示例代码http://matplotlib.org/examples/mplot3d/scatter3d_demo.html ,但情节呈现为静态图像。 我不能点击图表并dynamic旋转查看3D绘图数据。 我已经使用示例代码实现了静态3D图 – 使用(a)terminal内的ipython,(b)terminal内的ipython笔记本,以及(c)从Anaconda启动器启动的ipython笔记本。 我想我错过了一些非常基本的步骤,如假定的知识。 在过去的学习中,绘图已经打开了一个GUIgraphics查看器的Python应用程序。 (下面代码中的解决scheme2打开了这个。)也许我需要知道的代码导出到显示方法的输出图? (是的,使用%matplotlib(仅)作为没有内联或笔记本的第一行,如代码块中的注释所示。 以ipython笔记本为例: # These lines are comments # Initial setup from an online python notebook tutorial is below. # Note the first line "%matplotlib inline" this is how the tutorial has it. # Two solutions 1. use: "%matplotlib notebook" graphs appear dynamic in […]

在多个页面上的图的子图

我正面临堆叠许多数字的问题 问题是堆栈图垂直覆盖页面维度,并将所有graphics放在一个页面中,而不会因为页面的限制而改变页面。 如何在堆叠所有数字时更改页面。 \usepackage{subfig} \usepackage{float} \begin{figure}[hp] \centering \subfloat[Fig1]{\label{fig:1}\includegraphics[width=0.48\textwidth]{fig1}} \subfloat[Fig2]{\label{fig:2}\includegraphics[width=0.48\textwidth]{fig2}} \subfloat[Fig3]{\label{fig:3}\includegraphics[width=0.48\textwidth]{fig3}} \subfloat[Fig4]{\label{fig:4}\includegraphics[width=0.48\textwidth]{fig4}} \subfloat[Fig5]{\label{fig:5}\includegraphics[width=0.48\textwidth]{fig5}} \subfloat[Fig6]{\label{fig:6}\includegraphics[width=0.48\textwidth]{fig6}} \caption{……..} \label{……….} \end{figure} 我会非常感谢你的善意帮助。