²»¶®Õâ25¸öÃû´Ê£¬ºÃÒâ˼˵Äã¶®´óÊý¾Ý£¿
Èç¹ûÄã¸Õ½Ó´¥´óÊý¾Ý£¬Äã¿ÉÄÜ»á¾õµÃÕâ¸öÁìÓòºÜÄÑÒÔÀí½â£¬ÎÞ´ÓÏÂÊÖ¡£½üÈÕ£¬Ramesh DonthaÔÚDataConomyÉÏÁ¬·¢Á½ÆªÎÄÕ£¬¶óÒª¶øÈ«ÃæµØÏÈÈÝÁ˹ØÓÚ´óÊý¾ÝµÄ75¸öºËÐÄÊõÓÕâ²»½öÊÇ´óÊý¾Ý³õѧÕߺܺõÄÈëÃÅ×ÊÁÏ£¬¶ÔÓڸ߽״ÓÒµÈËÔ±Ò²¿ÉÒÔÆðµ½²é©²¹È±µÄ×÷Óá£
±¾ÎÄÏÈÏÈÈÝ ÁË25 ¸ö»ù±¾´óÊý¾ÝÊõÓ°ïÖúÄãιÊ֪У¬ÄÇô¿ªÊ¼°É~
01 Ëã·¨(Algorithm)
Ëã·¨¿ÉÒÔÀí½â³ÉÒ»ÖÖÊýѧ¹«Ê½»òÓÃÓÚ½øÐÐÊý¾Ý·ÖÎöµÄͳ¼ÆÑ§¹ý³Ì¡£ÄÇô£¬¡¸Ëã·¨¡¹ÓÖÊǺÎÒÔÓë´óÊý¾Ý³¶ÉϹØÏµµÄÄØ?ÒªÖªµÀ£¬¾¡¹ÜËã·¨Õâ¸ö´ÊÊÇÒ»¸öͳ³Æ£¬µ«ÊÇÔÚÕâ¸öÁ÷ÐдóÊý¾Ý·ÖÎöµÄʱ´ú£¬Ëã·¨Ò²¾³£±»Ìá¼°ÇÒ±äµÃÔ½·¢Á÷ÐС£
02 ·ÖÎö(Analytics analyze)
Èôó¼ÒÊÔÏëÒ»¸öºÜ¿ÉÄÜ·¢ÉúµÄÇé¿ö£¬ÄãµÄÐÅÓÿ¨ÆóÒµ¸øÄã·¢ÁË·â¼Ç¼×ÅÄãÈ«Ä꿨ÄÚ×ʽðתÕËÇé¿öµÄÓʼþ£¬Èç¹ûÕâ¸öʱºòÄãÄÃ×ÅÕâÕŵ¥×Ó£¬¿ªÊ¼ÈÏÕæÑо¿ÄãÔÚʳƷ¡¢ÒÂÎï¡¢ÓéÀֵȷ½ÃæÏû·ÑÇé¿öµÄ°Ù·Ö±È»áÔõÑù?ÄãÕýÔÚ½øÐзÖÎö¹¤×÷£¬ÄãÔÚ´ÓÄãÔʼµÄÊý¾Ý(ÕâЩÊý¾Ý¿ÉÒÔ°ïÖúÄãΪÀ´Äê×Ô¼ºµÄÏû·ÑÇé¿ö×÷³ö¾ö¶¨)ÖÐÍÚ¾òÓÐÓõÄÐÅÏ¢¡£
ÄÇô£¬Èç¹ûÄãÒÔÀàËÆµÄ·½·¨ÔÚÍÆÌØºÍFaceBookÉ϶ÔÕû¸ö³ÇÊÐÈËÃÇ·¢µÄÌû×Ó½øÐд¦Àí»áÈçºÎÄØ?ÔÚÕâÖÖÇé¿öÏ£¬´ó¼Ò¾Í¿ÉÒÔ³ÆÖ®Îª´óÊý¾Ý·ÖÎö¡£
Ëùν´óÊý¾Ý·ÖÎö£¬¾ÍÊǶԴóÁ¿Êý¾Ý½øÐÐÍÆÀí²¢´ÓÖеÀ³öÓÐÓõÄÐÅÏ¢¡£ÒÔÏÂÓÐÈýÖÖ²»Í¬ÀàÐ͵ķÖÎö·½·¨£¬ÏÖÔÚ´ó¼ÒÀ´¶ÔËüÃÇ·Ö±ð½øÐÐÊáÀí¡£
03 ÃèÊöÐÔ·ÖÎö·¨(Descriptive Analytics)
Èç¹ûÄãֻ˵³ö×Ô¼ºÈ¥ÄêÐÅÓÿ¨Ïû·ÑÇé¿öΪ£ºÊ³Æ··½Ãæ 25%¡¢ÒÂÎï·½Ãæ 35%¡¢ÓéÀÖ·½Ãæ 20%¡¢Ê£Ï 20% ΪÔÓÏ֧£¬ÄÇôÕâÖÖ·ÖÎö·½·¨±»³ÆÎªÃèÊöÐÔ·ÖÎö·¨¡£µ±È»£¬ÄãÒ²¿ÉÒÔÕÒ³ö¸ü¶àϸ½Ú¡£
04 Ô¤²âÐÔ·ÖÎö·¨(Predictive Analytics)
Èç¹ûÄã¶Ô¹ýÈ¥ 5ÄêÐÅÓÿ¨Ïû·ÑµÄÀúÊ·½øÐÐÁË·ÖÎö£¬·¢ÏÖÿÄêµÄÏû·ÑÇé¿ö»ù±¾ÉϳÊÏÖÒ»¸öÁ¬Ðø±ä»¯µÄÇ÷ÊÆ£¬ÄÇôÔÚÕâÖÖÇé¿öÏÂÄã¾Í¿ÉÒԸ߸ÅÂÊÔ¤²â³ö£ºÀ´ÄêµÄÏû·Ñ״̬Ӧ¸ÃºÍÒÔÍùÊÇÀàËÆµÄ¡£
Õâ²»ÊÇ˵´ó¼ÒÔÚÔ¤²âδÀ´£¬¶øÊÇÓ¦¸ÃÀí½âΪ£¬´ó¼ÒÔÚ¡¸ÓøÅÂÊÔ¤²â¡¹¿ÉÄÜ·¢ÉúʲôÊÂÇé¡£
ÔÚ´óÊý¾ÝµÄÔ¤²â·ÖÎöÖУ¬Êý¾Ý¿ÆÑ§¼Ò¿ÉÄÜ»áʹÓÃÏȽøµÄ¼¼Êõ£¬Èç»úÆ÷ѧϰ£¬ºÍÏȽøµÄͳ¼ÆÑ§´¦Àí·½·¨(Õⲿ·ÖºóÃæ´ó¼Ò»á̸µ½)À´Ô¤²âÌìÆøÇé¿ö¡¢¾¼Ã±ä»¯µÈµÈ¡£
05 ¹æ·¶ÐÔ·ÖÎö(Prescriptive Analytics)
ÕâÀï´ó¼Ò»¹ÊÇÓÃÐÅÓÿ¨×ªÕ˵ÄÀý×ÓÀ´Àí½â¡£¼ÙÈçÄãÏëÕÒ³ö×Ô¼ºµÄÄÄÀàÏû·Ñ(ÈçʳƷ¡¢ÓéÀÖ¡¢ÒÂÎïµÈµÈ)¿ÉÒÔ¶ÔÕûÌåÏû·Ñ²úÉú¾Þ´óÓ°Ï죬ÄÇô»ùÓÚÔ¤²âÐÔ·ÖÎö(Predictive Analytics)µÄ¹æ·¶ÐÔ·ÖÎö·¨Í¨¹ýÒýÈ롸¶¯Ì¬Ö¸±ê(action)¡¹(Èç¼õÉÙʳƷ»òÒÂÎï»òÓéÀÖ)ÒÔ¼°¶ÔÓɴ˲úÉúµÄ½á¹û½øÐзÖÎöÀ´¹æ¶¨Ò»¸ö¿ÉÒÔ½µµÍÄãÕûÌ忪ÏúµÄ×î¼ÑÏû·ÑÏî¡£
Äã¿ÉÒÔ½«ËüÑÓÉìµ½´óÊý¾ÝÁìÓò£¬²¢ÏëÏóÒ»¸ö¸ºÔðÈËÊÇÈçºÎͨ¹ý¹Û²ìËûÃæÇ°¶àÖÖ¶¯Ì¬Ö¸±êµÄÓ°Ï죬½ø¶ø×÷³öËùνÓÉ¡¸Êý¾ÝÇý¶¯¡¹µÄ¾ö²ßµÄ¡£
06 Åú´¦Àí(Batch processing)
¾¡¹ÜÅúÁ¿Êý¾Ý´¦Àí´Ó´óÐÍ»ú(mainframe)ʱ´ú¾ÍÒѾ´æÔÚÁË£¬µ«ÊÇÔÚ´¦Àí´óÁ¿Êý¾ÝµÄ´óÊý¾Ýʱ´úÃæÇ°£¬Åú´¦Àí»ñµÃÁ˸üÖØÒªµÄÒâÒå¡£
ÅúÁ¿Êý¾Ý´¦ÀíÊÇÒ»ÖÖ´¦Àí´óÁ¿Êý¾Ý(ÈçÔÚÒ»¶Îʱ¼äÄÚÊÕ¼¯µ½µÄÒ»¶Ñ½»Ò×Êý¾Ý)µÄÓÐЧ·½·¨¡£·Ö²¼Ê½¼ÆËã(Hadoop)£¬ºóÃæ»áÌÖÂÛ£¬¾ÍÊÇÒ»ÖÖרÃÅ´¦ÀíÅúÁ¿Êý¾ÝµÄ·½·¨¡£
07 Cassandra
ÊÇÒ»¸öºÜÁ÷ÐеĿªÔ´Êý¾Ý¹ÜÀíϵͳ£¬ÓÉApache Software Foundation ¿ª·¢²¢ÔËÓª¡£ApacheÕÆÎÕÁ˺ܶà´óÊý¾Ý´¦Àí¼¼Êõ£¬Cassandra¾ÍÊÇËûÃÇרÃÅÉè¼ÆÓÃÓÚÔÚ·Ö²¼Ê½·þÎñÆ÷Ö®¼ä´¦Àí´óÁ¿Êý¾ÝµÄϵͳ¡£
08 ÔÆ¼ÆËã(Cloud computing)
ËäÈ»ÔÆ¼ÆËãÕâ¸ö´ÊÏÖÔÚÒѾ¼ÒÓ÷»§Ïþ£¬ÕâÀï´ó¿É²»±Ø×¸Êö£¬µ«ÊÇΪÁËȫƪÄÚÈÝÍêÕûÐԵĿ¼ÂÇ£¬±ÊÕß»¹ÊÇÔÚÕâÀï¼ÓÈëÁËÔÆ¼ÆËã´ÊÌõ¡£±¾ÖÊÉϽ²£¬App»òÊý¾ÝÔÚÔ¶³Ì·þÎñÆ÷ÉϽøÐд¦Àí£¬²¢ÇÒÕâЩ×ÊÔ´¿ÉÒÔÔÚÍøÂçÉÏÈκεط½±»·ÃÎÊ£¬ÄÇôËü¾Í¿É±»³ÆÎªÔƼÆËã¡£
09 ¼¯Èº¼ÆËã(Cluster computing)
ÕâÊÇÒ»¸öÀ´ÃèÊöʹÓöà¸ö·þÎñÆ÷·á¸»×ÊÔ´µÄÒ»¸ö¼¯Èº(cluster)µÄ¼ÆËãµÄÐÎÏó»¯ÊõÓï¡£¸ü¼¼Êõ²ãÃæµÄÀí½âÊÇ£¬ÔÚ¼¯Èº´¦ÀíµÄÓᄈϣ¬´ó¼Ò¿ÉÄÜ»áÌÖÂÛ½Úµã(node)¡¢¼¯Èº¹ÜÀí²ã(cluster management layer)¡¢¸ºÔØÆ½ºâ(load balancing)ºÍ²¢Ðд¦Àí(parallel processing)µÈµÈ¡£
10 °µÊý¾Ý(Dark data)
ÕâÊÇÒ»¸öÉúÔì´Ê£¬ÔÚ±ÊÕß¿´À´£¬ËüÊÇÓÃÀ´ÏÅ»£ÈË£¬Èø߼¶¹ÜÀíÌýÉÏÈ¥»ÞɬÄѶ®µÄ¡£
»ù±¾¶øÑÔ£¬Ëùν°µÊý¾ÝÖ¸µÄÊÇ£¬ÄÇЩÆóÒµ»ýÀۺʹ¦ÀíµÄʵ¼ÊÉÏÍêÈ«Óò»µ½µÄËùÓÐÊý¾Ý£¬´ÓÕâ¸öÒâÒåÉÏÀ´Ëµ´ó¼Ò³ÆËüÃÇΪ¡¸°µ¡¹µÄÊý¾Ý£¬ËüÃÇÓпÉÄܸù±¾²»»á±»·ÖÎö¡£ÕâЩÊý¾Ý¿ÉÒÔÊÇÉç½»ÍøÂçÖеÄÐÅÏ¢£¬µç»°ÖÐÐĵļǼ£¬»áÒé¼Ç¼µÈµÈ¡£
ºÜ¶à¹À¼ÆÈÏΪËùÓÐÆóÒµµÄÊý¾ÝÖÐÓÐ60%µ½90%²»µÈ¿ÉÄÜÊǰµÊý¾Ý£¬µ«Êµ¼ÊÉÏûÈËÖªµÀ¡£
11 Êý¾Ýºþ(Data lake)
µ±±ÊÕßµÚÒ»´ÎÌýµ½Õâ¸ö´Êʱ£¬ÕæµÄÒÔΪÕâÊǸöÓÞÈ˽ÚЦ»°¡£µ«ÊÇËüÕæµÄÊÇÒ»¸öÊõÓï¡£ËùÒÔÒ»¸öÊý¾Ýºþ(data lake)¼´Ò»¸öÒÔ´óÁ¿Ôʼ¸ñʽ±£´æÁËÆóÒµ¼¶±ðµÄÊý¾Ý³£Ê¶¿â¡£ÕâÀï´ó¼ÒÏÈÈÝÒ»ÏÂÊý¾Ý²Ö¿â(Data warehouse)¡£
Êý¾Ý²Ö¿âÊÇÒ»¸öÓëÕâÀïÌáµ½µÄÊý¾ÝºþÀàËÆµÄ¸ÅÄµ«²»Í¬µÄÊÇ£¬Ëü±£´æµÄÊǾ¹ýÇåÀíºÍ²¢ÇÒÆäËü×ÊÔ´ÕûºÏºóµÄ½á¹¹»¯Êý¾Ý¡£
Êý¾Ý²Ö¿â¾³£±»ÓÃÓÚͨÓÃÊý¾Ý(µ«²»Ò»¶¨Èç´Ë)¡£Ò»°ãÈÏΪ£¬Ò»¸öÊý¾Ýºþ¿ÉÒÔÈÃÈ˸ü·½±ãµØ½Ó´¥µ½ÄÇЩÄãÕæÕýÐèÒªµÄÊý¾Ý£¬´ËÍ⣬ÄãÒ²¿ÉÒÔ¸ü·½±ãµØ´¦Àí¡¢ÓÐЧµØÊ¹ÓÃËüÃÇ¡£
12 Êý¾ÝÍÚ¾ò(Data mining)
Êý¾ÝÍÚ¾ò¹ØºõÈçϹý³Ì£¬´ÓÒ»´óȺÊý¾ÝÖÐÒÔ¸´ÔÓµÄģʽʶ±ð¼¼ÇÉÕÒ³öÓÐÒâÒåµÄģʽ£¬²¢Çҵõ½Ïà¹Ø¶´¼û¡£ËüÓëǰÎÄËùÊöµÄ¡¸·ÖÎö¡¹Ï¢Ï¢Ïà¹Ø£¬ÔÚÊý¾ÝÍÚ¾òÖУ¬Ä㽫»áÏȶÔÊý¾Ý½øÐÐÍÚ¾ò£¬È»ºó¶ÔÕâЩµÃµ½µÄ½á¹û½øÐзÖÎö¡£
ΪÁ˵õ½ÓÐÒâÒåµÄģʽ(pattern)£¬Êý¾ÝÍÚ¾òÈËÔ±»áʹÓõ½Í³¼ÆÑ§(Ò»ÖÖ¾µäµÄ¾É·½·¨)¡¢»úÆ÷ѧϰËã·¨ºÍÈ˹¤ÖÇÄÜ¡£
13 Êý¾Ý¿ÆÑ§¼Ò
Êý¾Ý¿ÆÑ§¼ÒÊÇʱÏ·dz£ÐԸеÄÒ»ÃÅÐÐÒµ¡£ËüÖ¸ÄÇЩ¿ÉÒÔͨ¹ýÌáÈ¡ÔʼÊý¾Ý(Õâ¾ÍÊÇ´ó¼ÒÇ°ÃæËùνµÄÊý¾Ýºþ)½ø¶øÀí½â¡¢´¦Àí²¢µÃ³ö¶´¼ûµÄÕâÑùÒ»ÅúÈË¡£
²¿·ÖÊý¾Ý¿ÆÑ§¼Ò±Ø±¸µÄ¼¼ÄÜ¿ÉÒÔ˵ֻÓг¬È˲ÅÓУº·ÖÎöÄÜÁ¦¡¢Í³¼ÆÑ§¡¢¼ÆËã»ú¿ÆÑ§¡¢´´ÔìÁ¦¡¢½²¹ÊÊÂÄÜÁ¦ÒÔ¼°Àí½âÉÌÒµ±³¾°µÄÄÜÁ¦¡£ÄѹÖÕâ°ïÈ˹¤×ʺܸߡ£
14 ·Ö²¼Ê½Îļþϵͳ(Distributed File System)
´óÊý¾ÝÊýÁ¿Ì«´ó£¬²»ÄÜ´æ´¢ÔÚÒ»¸öµ¥¶ÀµÄϵͳÖУ¬·Ö²¼Ê½ÎļþϵͳÊÇÒ»¸öÄܹ»°Ñ´óÁ¿Êý¾Ý´æ´¢ÔÚ¶à¸ö´æ´¢É豸ÉϵÄÎļþϵͳ£¬ËüÄܹ»¼õÉÙ´æ´¢´óÁ¿Êý¾ÝµÄ³É±¾ºÍ¸´ÔÓ¶È¡£
15 ETL
ETL´ú±íÌáÈ¡¡¢×ª»»ºÍ¼ÓÔØ¡£ËüÖ¸µÄÊÇÕâÒ»¸ö¹ý³Ì£º¡¸ÌáÈ¡¡¹ÔʼÊý¾Ý£¬Í¨¹ýÇåÏ´/·á¸»µÄÊֶΣ¬°ÑÊý¾Ý¡¸×ª»»¡¹Îª¡¸ÊʺÏʹÓá¹µÄÐÎʽ£¬²¢ÇÒ½«Æä¡¸¼ÓÔØ¡¹µ½ºÏÊʵĿâÖй©ÏµÍ³Ê¹Óá£
¼´Ê¹ETLÔ´×ÔÊý¾Ý²Ö¿â£¬µ«ÊÇÕâ¸ö¹ý³ÌÔÚ»ñÈ¡Êý¾ÝµÄʱºòÒ²ÔÚ±»Ê¹Óã¬ÀýÈ磬ÔÚ´óÊý¾ÝϵͳÖдÓÍⲿԴ»ñµÃÊý¾Ý¡£
16 Hadoop
µ±ÈËÃÇ˼¿¼´óÊý¾ÝµÄʱºò£¬ËûÃÇ»áÂíÉÏÏëµ½Hadoop¡£
HadoopÊÇÒ»¸ö¿ªÔ´App¼Ü¹¹(logoÊÇһͷ¿É°®µÄ´óÏó)£¬ËüÓÉ Hadoop·Ö²¼Ê½Îļþϵͳ(HDFS)¹¹³É£¬ËüÔÊÐíʹÓ÷ֲ¼Ê½Ó²¼þ¶Ô´óÊý¾Ý½øÐд洢¡¢³éÏóºÍ·ÖÎö¡£
Èç¹ûÄãÕæµÄÏëÈÃijÈ˶ÔÕâ¸ö¶«Î÷Ó¡ÏóÉî¿Ì£¬Äã¿ÉÒÔ¸úËû˵ YARN(Yet Another Resource Scheduler)£¬¹ËÃû˼Ò壬¾ÍÊÇÁíÒ»¸ö×ÊÔ´µ÷¶ÈÆ÷¡£ÎÒȷʵ±»Ìá³öÕâЩÃû×ÖµÄÈËÉîÉîÕðº³ÁË¡£
Ìá³ö Hadoop µÄ Apache »ù½ð»á£¬»¹¸ºÔð Pig¡¢Hive ÒÔ¼° Spark(Õâ¶¼ÊÇһЩAppµÄÃû×Ö)¡£ÄãûÓб»ÕâЩÃû×Ö¾ªÑÞµ½Âð?
17 ÄÚ´æ¼ÆËã(In-memory computing)
ͨ³£ÈÏΪ£¬Èκβ»Éæ¼°µ½ I/O·ÃÎʵļÆËã¶¼»á¸ü¿ìһЩ¡£ÄÚ´æ¼ÆËã¾ÍÊÇÕâÑùµÄ¼¼Êõ£¬Ëü°ÑËùÓеŤ×÷Êý¾Ý¼¯¶¼Òƶ¯µ½¼¯ÈºµÄ¼¯ÌåÄÚ´æÖУ¬±ÜÃâÁËÔÚ¼ÆËã¹ý³ÌÖÐÏò´ÅÅÌдÈëÖмä½á¹û¡£
Apache Spark ¾ÍÊÇÒ»¸öÄÚ´æ¼ÆËãµÄϵͳ£¬ËüÏà¶Ô Mapreduce ÕâÀà I/O °ó¶¨µÄϵͳ¾ßÓкܴóµÄÓÅÊÆ¡£
18 ÎïÁªÍø(IoT)
×îеÄÁ÷ÐÐÓï¾ÍÊÇÎïÁªÍø(IoT)¡£IoT ÊÇǶÈëʽ¶ÔÏóÖÐ(Èç´«¸ÐÆ÷¡¢¿É´©´÷É豸¡¢³µ¡¢±ùÏäµÈµÈ)µÄ¼ÆËãÉ豸ͨ¹ýÓ¢ÌØÍøµÄ»¥Áª£¬ËüÃÇÄܹ»ÊÕ·¢Êý¾Ý¡£ÎïÁªÍøÉú³ÉÁ˺£Á¿µÄÊý¾Ý£¬´øÀ´Á˺ܶà´óÊý¾Ý·ÖÎöµÄ»úÓö¡£
19 »úÆ÷ѧϰ(Machine Learning)
»úÆ÷ѧϰÊÇ»ùÓÚιÈëµÄÊý¾ÝÈ¥Éè¼ÆÄܹ»Ñ§Ï°¡¢µ÷ÕûºÍÌáÉýµÄϵͳµÄÒ»ÖÖ·½·¨¡£Ê¹ÓÃÉ趨µÄÔ¤²âºÍͳ¼ÆËã·¨£¬ËüÃdzÖÐøµØ±Æ½ü¡¸ÕýÈ·µÄ¡¹ÐÐΪºÍÏë·¨£¬Ëæ×Ÿü¶àµÄÊý¾Ý±»ÊäÈ뵽ϵͳ£¬ËüÃÇÄܹ»½øÒ»²½ÌáÉý¡£
20 MapReduce
MapReduce¿ÉÄÜÓеãÄÑÒÔÀí½â£¬ÎÒÊÔ×Å˵Ã÷һϰɡ£
MapReduceÊÇÒ»¸ö±à³ÌÄ£ÐÍ£¬×îºÃµÄÀí½â¾ÍÊÇҪעÒâµ½MapºÍReduceÊÇÁ½¸ö²»Í¬µÄ¹ý³Ì¡£
ÔÚ MapReduceÖУ¬³ÌÐòÄ£ÐÍÊ×ÏȽ«´óÊý¾Ý¼¯·Ö¸î³ÉһЩС¿é(ÕâЩС¿éÄü¼ÊõÊõÓïÀ´½²½Ð×ö¡¸Ôª×项£¬µ«ÊÇÎÒÃèÊöµÄʱºò»á¾¡Á¿±ÜÃâ»ÞɬµÄ¼¼ÊõÊõÓï)£¬È»ºóÕâЩС¿é»á±»·Ö·¢¸ø²»Í¬Î»ÖÃÉϵIJ»Í¬¼ÆËã»ú(Ò²¾ÍÊÇ˵֮ǰÃèÊö¹ýµÄ¼¯Èº)£¬ÕâÔÚMap¹ý³ÌÊDZØÐëµÄ¡£
È»ºóÄ£ÐÍ»áÊÕ¼¯Ã¿¸ö¼ÆËã½á¹û£¬²¢ÇÒ½«ËüÃÇ¡¸reduce¡¹³ÉÒ»¸ö²¿·Ö¡£MapReduceµÄÊý¾Ý´¦ÀíÄ£ÐͺÍHadoop·Ö²¼Ê½ÎļþϵͳÊÇ·Ö²»¿ªµÄ¡£
21 ·Ç¹ØÏµÐÍÊý¾Ý¿â(NoSQL)
Õâ¸ö´ÊÌýÆðÀ´¼¸ºõ¾ÍÊÇ¡¸SQL£¬½á¹¹»¯²éѯÓïÑÔ¡¹µÄ·´Òå´Ê£¬SQL ÊÇ´«Í³µÄ¹ØÏµÐÍÊý¾Ý¹ÜÀíϵͳ(RDBMS)±ØÐèµÄ£¬µ«ÊÇ NOSQL ʵ¼ÊÉÏÖ¸µÄÊÇ¡¸²»Ö¹SQL¡¹¡£
NoSQLʵ¼ÊÉÏÖ¸µÄÊÇÄÇЩ±»Éè¼ÆÀ´´¦ÀíûÓнṹ(»òÕßûÓС¸schema¡¹£¬¸ÙÒª)µÄ´óÁ¿Êý¾ÝµÄÊý¾Ý¿â¹ÜÀíϵͳ¡£NoSQL ÊʺϴóÊý¾Ýϵͳ£¬ÒòΪ´ó¹æÄ£µÄ·Ç½á¹¹»¯Êý¾Ý¿âÐèÒª NoSQLµÄÕâÖÖÁé»îÐԺͷֲ¼Ê½ÓÅÏȵÄÌØµã¡£
22 RÓïÑÔ
Õ⻹ÓÐÈËÄܸøÒ»¸ö±à³ÌÓïÑÔÆðÒ»¸ö¸ü¼ÓÔã¸âµÄÃû×ÖÂð?R ÓïÑÔ¾ÍÊÇÕâÑùµÄÓïÑÔ¡£²»¹ý£¬R ÓïÑÔÊÇÒ»¸öÔÚͳ¼Æ¹¤×÷Öй¤×÷µÃºÜºÃµÄÓïÑÔ¡£Èç¹ûÄã²»ÖªµÀ R ÓïÑÔ£¬±ð˵ÄãÊÇÊý¾Ý¿ÆÑ§¼Ò¡£ÒòΪ R ÓïÑÔÊÇÊý¾Ý¿ÆÑ§ÖÐ×îÁ÷Ðеıà³ÌÓïÑÔÖ®Ò»¡£
23 Spark(Apache Spark)
Apache Spark ÊÇÒ»¸ö¿ìËÙµÄÄÚ´æÊý¾Ý´¦ÀíÒýÇæ£¬ËüÄܹ»ÓÐЧµØÊµÐÐÄÇЩÐèÒªµü´ú·ÃÎÊÊý¾Ý¿âµÄÁ÷´¦Àí¡¢»úÆ÷ѧϰÒÔ¼°SQL¸ºÔØ¡£Sparkͨ³£»á±È´ó¼ÒÇ°ÃæÌÖÂÛ¹ýµÄMapReduce ¿ìºÃ¶à¡£
24 Á÷´¦Àí(Stream processing)
Á÷´¦Àí±»Éè¼ÆÀ´ÓÃÓÚ³ÖÐøµØ½øÐÐÁ÷Êý¾ÝµÄ´¦Àí¡£ÓëÁ÷·ÖÎö¼¼Êõ(Ö¸µÄÊÇÄܹ»³ÖÐøµØ¼ÆËãÊýÖµºÍͳ¼Æ·ÖÎöµÄÄÜÁ¦)½áºÏÆðÀ´£¬Á÷´¦Àí·½·¨ÌرðÄܹ»Õë¶Ô´ó¹æÄ£Êý¾ÝµÄʵʱ´¦Àí¡£
25 ½á¹¹»¯vs·Ç½á¹¹»¯Êý¾Ý(Structured v Unstructured Data)
ÕâÊÇ´óÊý¾ÝÖеĶԱÈÖ®Ò»¡£½á¹¹»¯Êý¾Ý»ù±¾ÉÏÊÇÄÇЩÄܹ»±»·ÅÔÚ¹ØÏµÐÍÊý¾Ý¿âÖеÄÈκÎÊý¾Ý£¬ÒÔÕâÖÖ·½Ê½×éÖ¯µÄÊý¾Ý¿ÉÒÔÓëÆäËûÊý¾Ýͨ¹ý±í¸ñÀ´¹ØÁª¡£
·Ç½á¹¹»¯Êý¾ÝÊÇÖ¸Èκβ»Äܹ»±»·ÅÔÚ¹ØÏµÐÍÊý¾Ý¿âÖеÄÊý¾Ý£¬ÀýÈçÓʼþÐÅÏ¢¡¢É罻ýÌåÉϵÄ״̬£¬ÒÔ¼°ÈËÀàÓïÒôµÈµÈ¡£