大数据 资源专区

本专区汇聚了各类基于 大数据 开发的源码资源,共计 101 篇资源供开发者免费下载学习。

共找到 101 个资源
其他 1 积分

文档数字出现次数统计工具

用map统计一个文档中各个数字出现的次数,可以统计数据量很大的文档中各个数字出现的字数。可用于统计使用。

数字统计 文档分析 数据处理
0 0 查看详情
其他 1 积分

基于Hadoop的分布式词频统计

应用背景此代码计数各个单词出现的次数从一组文件。包括制图,减速器和驱动。读取时间映射一线分为(键,值)对..从映射的输出作为输入到减速器..输出映射是关键,;——;——关键,关键,

Hadoop MapReduce 词频统计
0 0 查看详情
其他 1 积分

KDDCUP 2012 大数据集存储结构设计

让你实现了一个数据结构来存储一个非常大的数据集的KDDCUP 2012设计

大数据 KDDCUP 数据结构
0 0 查看详情
其他 1 积分

Rails批处理插件:优化大数据量计算

Boling For Batches v1.0.2 Plugin for Rails I often need to execute really large comput

Rails 批处理 内存优化
0 0 查看详情
其他 1 积分

Coursera大数据课程:火星任务数据处理

关于大数据的Coursera课程的第二个任务。火星任务

Coursera 大数据 火星任务
0 0 查看详情
其他 1 积分

Coursera大数据课程任务一

Coursera课程关于大数据的任务。第一项任务。

Coursera 大数据 任务
0 0 查看详情
其他 1 积分

Nut:基于Lucene与Hadoop的分布式搜索框架

1、概述 不管程序性能有多高,机器处理能力有多强,都会有其极限。能够快速方便的横向与纵向扩展是Nut设计最重要的原则,以此原则形成以分布式并行计算为核心的架构设计。以分布式并行计

分布式搜索 Lucene Hadoop
0 0 查看详情
其他 1 积分

IBM技术论坛的MapReduce工具软件

mapreduce的工具软件。来源为ibm 的技术论坛。-mapreduce software tools. Source for ibm technical forum.

MapReduce 大数据 分布式计算
0 0 查看详情
其他 1 积分

基于Hadoop的并行回归框架

This package provides a unified framework for parallel regression algorithms using gradien

Hadoop 并行回归 大数据
0 0 查看详情
其他 1 积分

动态分布式K-均值聚类系统

Distributed K-means Algorithm K-means clustering is a well-known and well-studied explor

分布式K-均值 聚类算法 去中心化
0 0 查看详情
其他 1 积分

Hyracks:数据密集型作业的数据并行平台

Hyracks is a data parallel platform to run data-intensive jobs on a cluster of shared-noth

数据并行 集群计算 数据密集型
0 0 查看详情
其他 1 积分

共享循环文件扫描原型MapReduce

This code is a prototype for Shared Cyclical File Scanning whereby instead of different Ma

MapReduce 文件扫描 分布式系统
0 0 查看详情