大數據架構師的基本職責

大數據架構師的基本職責 篇1

職責:

1.負責整個大數據平台架構的設計和構建;

2.負責構建大數據平台的數據交換、任務調度等通用平台;

3.制定開發、測試、實施、維護的標準和規範,指導和培訓工程師,不斷提升團隊能力。

4.參與系統需求分析、架構設計、技術選型、套用設計與開發以及測試與部署,負責編寫核心部分代碼。

5.持續挑戰新的技術方向,攻克大數據量、高並發、高可用、可擴展等技術難點。

任職要求:

1.3年以上大數據架構經驗,豐富的數據倉庫、數據挖掘、機器學習項目經驗

2.大規模數據處理的架構和設計實戰經驗

3.精通Spark、MR,熟練HDFS、Yarn、Hbase、Hive、MongoDB,熟悉Kafka、Redis、Storm、Mahout、Flume、ElasticSearch、GraphDB(NEO4J或其他)等,並具有豐富的大型數據平台工程經驗

4.深刻理解大數據處理(流計算,分散式計算,分散式檔案系統,分散式存儲等)相關技術和實現方法

5.熟悉主數據、元數據、數據質量等企業數據管理相關的體系和方法,熟練Linux/Unix平台上的開發環境

6.本科或以上學歷,計算機軟體或相關專業,豐富的java開發經驗和網際網路背景優先。

7.具有比較強的問題分析和處理能力,有比較優秀的動手能力,熱衷技術,精益求精

大數據架構師的基本職責 篇2

職責:

1. 深刻理解政府行業業務模式,構建政府行業的數據模型,制定公司大數據技術發展路線;

2. 對接業務研究和技術部門,主動蒐集和轉化需求,組織數據中心業務開發,進行數據相關產品需求分析和設計;

3. 搭建數據倉庫,研發資料庫管理系統,蒐集、提取、處理業務積累的海量數據,開展數據分析和挖掘;

4. 根據公司戰略和發展需要,規劃數據中心重點工作和任務;落實部門人員、事務管理,開展跨部門、跨地區協作,協助對外交流與合作。

職位要求:

1. 5年以上相關工作經驗,有團隊管理和項目管理經驗者優先;

2.了解政府運作機制,掌握財政行業知識,有電子政務行業經驗者優先;

3. 熟練掌握使用Java或Python,精通資料庫查詢語言如SQL,Oracle等,在機器學習模型和算法方向有套用經驗者優先;

4. 具備數據中心產品策劃整體思維,有大數據處理、分析、挖掘經驗者優先;

5. 邏輯思維嚴密,具備業務抽象、分解和標準化的能力,口頭和書面表達優秀;

6. 有較強的大局意識和良好的團隊合作意識,富有領導力,具備優秀的人際交往和溝通能力。

大數據架構師的基本職責 篇3

職責:

1、負責大數據平台的架構設計、核心代碼開發等任務;根據項目要求編寫相關技術文檔;

2、負責大數據平台的架構評審,代碼評審,上線評審;參與數據套用需求、設計、審核和評審;

3、負責核心模組研發,負責大數據平台的搭建,完成系統調試、集成與實施;

4、負責建立和維護大數據平台技術標準規範,指導開發人員編寫代碼;

任職要求:

1、本科及以上計算機相關專業畢業;

2、精通離線和實時數據處理流程,掌握離線數據處理框架hive、impala、spark-sql等,掌握實時數據處理常用技術工具,包括Storm、SparkStreaming等;

3、熟悉大數據技術生態圈,精通大數據技術架構,有大數據平台構建經驗;

4、掌握常見數據流接入工具,包括Flume、kafka等;

5、熟練掌握基本的Linux作業系統和某種腳本語言編程(如Shell等);

6、掌握一種或以上實時處理語言,如JAVA、SCALA、PYTHON等,有SCALA經驗者優先;

7、有實際大規模數據(TB級以上)處理經驗優先;

大數據架構師的基本職責 篇4

職責:

1、從事電信行業大數據項目相關業務調研、產品標準建設、核心模型設計和最佳化、系統測試等相關工作

2、與數據專業委員會一起研究數據建模方案和建模工具,負責產品線產品的數據架構、數據模型設計

3、參與研究資料庫之間的數據轉換方式,參與項目中的數據移植工作,收集在項目中的數據移植經驗,最佳化產品的數據模型

4、負責培訓本部門隊伍的數據模型基礎理論工作,建立數據模型團隊

崗位要求:

1、統招本科學歷,3年以上主流數據上(DB2、Oracle、SQLServer、Mysql等)ETL設計、開發經驗,具備大型數據倉庫邏輯模型和物理模型設計經驗,精通SQL,有較好的SQL性能調優經驗;

2、擁有Python,R等數學建模工具的使用經驗,並具備一定的數據處理和建模經驗,可以輸出相應的模型分析結果、模型比較、模型效率以及對模型的理論和判斷依據方法並對其進行完整的解釋和說明;

3、熟悉統計學基本原理,做過實戰的數據建模項目;

4、有分散式數據倉庫建設相關經驗者優先,具備電信行業數據倉庫建設相關經驗者優先;

大數據架構師的基本職責 篇5

職責:

1、負責公司的大數據處理框架的研發設計工作,梳理可實現方案和技術規範;

2、開發、完善公司大數據平台;參與公司離線、實時大數據處理系統的設計、開發、測試及多個業務模組的自動化集成;

3、負責業務平台數據統計分析模組的設計與規劃;

4、負責公司產品研發過程中的數據及存儲設計;

5、帶領和培養團隊完成組織分解的目標;

任職要求:

1、統招本科及以上學歷,計算機、軟體工程相關專業,至少8年以上工作經驗,5年以上大數據開發經驗;

2、熟悉Java、Hadoop、HDFS、Hive、HBase、Spark、Storm、Flume等相關技術的基礎架構

3、熟悉數據倉庫,數據算法,分散式計算技術理論,具有大數據整體系統架構設計經驗;

4、熟悉Linux系統,熟練使用shell/perl/python腳本處理問題;

5、對深度學習框架(Tensorflow)和機器學習(svm 隨機深林貝葉斯等)有一定了解的優先;

6、能夠組織項目開發組協同工作,包括團隊溝通、計畫、開發環境管理等

大數據架構師的基本職責 篇6

職責:

1、負責自然語音互動、IOT家電物聯控制、知識圖譜等相關模組和系統的開發;

2、負責掌握第三方接口的調用和功能實現,持續最佳化服務性能和容量,並保證產品的兼容性和執行效率;

3、根據設計文檔和需求說明完成代碼編寫、調試、單元測試與維護,確保項目進度和質量;

4、協助制定測試計畫,及時發現並修復BUG,實現服務端的性能最佳化。

任職資格:

1、大學本科3年以上工作經驗,計算機相關專業;

2、熟悉軟體項目開發流程,具有良好編碼風格及文檔編寫能力;

3、熟悉Linux伺服器相關技術,能夠獨立完成伺服器部署,具有相關經驗;

4、熟悉Hadoop/Spark框架,JAVA基礎紮實;

5、熟練使用Mysql資料庫,了解MongoDB或neo4j等分散式資料庫;

6、熟悉SpringCloud,SSM,Docker,redis開發者優先;

7、熟悉前端(包括但不限於Html5、css、Angularjs、ajax、jquery等)開發技術優先;

8、了解Socket網路編程、MQTT等,有相應實踐經驗者優先;

9、有智慧型語音語義、知識圖譜服務端開發經驗者優先。

大數據架構師的基本職責 篇7

職責:

1、負責大數據平台架構的規劃與設計;

2、負責大數據平台技術框架的選型與技術難點攻關;

3、參與企業級大數據產品和套用規劃;

4、研究跟進大數據架構領域新技術並分享;

5、大數據處理和分析套用平台的設計指導。

任職資格:

1、 具備深厚的分散式系統或資料庫系統的理論基礎,熟悉分散式計算系統的工作機制,具有分散式檔案系統、分散式資料庫系統、集群存儲系統等架構設計經驗;

2、熟悉BI平台架構及相關項目標準,大數據解決方案包括Hadoop、Spark、Storm、機器學習等大數據平台解決方案;

3、熟悉MySql/Postgresql/Oracle/MongoDB/Redis等主流數據資料庫;

4、 精通Linux/Unix環境,精通J java、scala、python、R中的一種或多種語言;

5、 具備優秀的團隊意識和溝通能力,學習能力和主動性強,具有鑽研精神,充滿激情,樂於接受挑戰;

6、大專及以上學歷,3年及以上工作經驗。

大數據架構師的基本職責 篇8

職責:

負責公司大數據產品架構的設計與實現;

配合大數據產品經理完成產品的快速研發與交付;

負責大數據產品架構的持續最佳化設計;

負責大數據產品核心組件設計;

負責大數據相關數據架構規劃、數據建模、資料庫設計以及大數據產品研發工作;

為套用開發團隊提供技術支撐。

任職要求:

本科及以上學歷,3年以上的大數據開發經驗、

2年以上大數據架構設計經驗;

豐富的JAVA研發經驗,精通JAVA,熟悉Python Scala等程式語言;具備深厚的分散式系統或資料庫系統的理論基礎,熟悉分散式計算系統的工作機制,具有分散式檔案系統、分散式資料庫系統、集群存儲系統等架構設計經驗;

熟悉整個大數據的完整處理流程(數據的採集、清洗、預處理、存儲、分析挖掘、機器學習和數據可視化);

精通各種大數據相關技術體系:Hadoop、Spark、Storm、ElasticSearch、Kafka;

有數據挖掘、機器學習相關套用或研究背景;

溝通能力較好,積極主動意識較強,責任心較強。

大數據架構師的基本職責 篇9

職責:

1. 負責大數據基礎平台、海量數據存儲/處理分散式平台、數據分析系統架構設計和研發;

2. 負責實時計算平台基礎架構設計、部署、監控、最佳化升級;

3. 制定項目/數據倉庫設計及實現規範,指導設計研發和部署;

4. 協助策略和算法團隊工作,保障數據挖掘建模和工程化;

5. 深入研究大數據相關技術和產品,跟進業界先進技術。

任職要求:

1. 全日制本科及以上學歷,5年以上軟體和分散式系統研發經驗,3年以上大數據系統架構經驗;

2. 精通Hadoop/HBase/Spark/Storm/Redis技術及其生態圈;

3. 具備Java/C++/Scala等開發經驗,熟悉數據挖掘和分析的策略與算法;

4. 具備良好的系統分析能力、故障診斷能力;

5. 有大數據策略、算法、可視化經驗優先;

6、211/985 重點學校畢業優先。

大數據架構師的基本職責 篇10

1. 負責數瀾大數據平台的架構設計和研發,建立數據生態服務,解決海量數據面臨的挑戰;

2. 管理和最佳化Hadoop、Spark等集群,計算作業的調優,保證集群和平台的高效和穩定;

3. 負責Hadoop、Spark、Flink的功能、性能和擴展,解決並實現業務需求;

4. 負責大數據產品的自動化、離線與實時計算、即席計算、數據質量、數據安全、機器學習等平台的設計和開發;

5. 調研和把握當前的最新技術,將其中的先進技術引入到自己的平台中,改善產品,提升競爭力;

大數據架構師的基本職責 篇11

職責:

1.能夠帶領技術人員基於hadoop平台進行海量數據套用系統開發;

2.負責結構化和非結構化數據的解析和清洗,海量數據查詢和報表展現;

3.負責超大規模數據平台的搭建、維護和最佳化;

4.負責大數據採集、存儲框架研究,參與線上或離線數據存儲模型設計;

5.負責大數據平台新技術的開發使用和性能最佳化,測試。

任職資格:

1.計算機相關專業本科及以上學歷;

2. 熟悉hadoop相關各種開源項目,比如HDFS/Hive/Hbase等有實際套用。(5年以上開發經驗者優先);

3.兩年以上熟練編寫mapreduce代碼經驗,有三年以上網路日誌分析、ETL經驗。熟悉日誌分析框架chukwa,flume,scribe者優先;

4.兩年以上海量數據存儲的安裝部署、最佳化、二次開發經驗,對大規模數據存儲、傳輸、處理等有豐富的經驗;

5.在數據挖掘、數據密集型處理、分散式計算、格線計算領域有深入理論基礎;

6.具有較強的文檔撰寫能力,較強的團隊精神和合作精神,對工作有熱情,能承受壓力。

大數據架構師的基本職責 篇12

職責:

1. 負責大數據基礎和套用平台的整體規劃和架構設計,參與需求分析,架構設計,詳細設計以及技術選型決策

2. 參與數據挖掘和建模相關核心算法的代碼實現

3. 負責大數據算法平台的技術把關,性能調優,控制架構質量,解決項目技術難題;對研發項目和任務需求進行評估和方案設計、拆分任務並指導工程師完成開發

4. 帶領團隊提供並實現大數據算法平台上各項數據接入、數據挖掘分析及數據可視化的架構設計與能力,支持解決方案實施

5. 負責資料庫設計、套用架構設計、核心技術選型等工作

6. 協調解決開發中的技術問題、設計和監控運營指標,保障系統穩定運行

7. 培養,指導有能力的員工,指導工程師進行技術驗證實現,核心技術攻關,解決開發過程中的技術難題

任職要求:

1. 熟悉大數據和數據倉庫的系統架構設計方法

2. 熟練使用並理解HadoopSpark架構及生態。(Hadoop,Hive,Hbase,Elasticsearch,Kafka,SparkFlink等)

3. 熟悉分散式系統架構,有分散式實時、離線和機器學習平台的架構和開發經驗,具備海量數據清洗、分析處理及存儲的實踐經驗

4. 熟練使用JAVA,具有大規模分散式系統調優經驗

5. 熟悉AI相關算法,熟悉機器學習、深度學習。熟悉AI學習開源框架(Tensorflow、PyTorch等)者優先;

6. 具備良好的團隊合作精神,對工作充滿激情。

7. 熟悉FusionInsight平台開發經驗者優先

大數據架構師的基本職責 篇13

職責:

1、搭建基於Hadoop/Spark的數據挖掘體系和大數據分析系統架構;

2、研究大數據領域前沿數據挖掘技術,並引入相應技術在數據中心的使用;

3、進行大數據系統框架設計、模型算法開發;

4、負責大型數據挖掘項目方案制定、項目實施落地及最佳化等 ;

5、開展數據爬取、聚類分析、輿情分析、魚骨圖分析、定價策略等領域數據挖掘工作;

任職資格:

1、本科以上學歷(持有學士學位)(985,211優先),計算機相關專業,五年工作經驗;

2、二年以上數據挖掘項目經驗,完整參與過數據挖掘大數據平台的架構開發過程,具備網際網路行業背景優先;

3、精通分散式計算框架(hadoop、spark、Storm等)及相關經驗,熟練掌握Hive/SQL,Python,熟悉Python、R相關數值科學計算庫(NumPy,SciPy等);

4、了解傳統的BI/DW 理論,能結合傳統BI實踐設計大數據平台;

5、熟悉常用機器學習算法(如分類、回歸、聚類、關聯規則等)及其原理,具備套用場景經驗,如用戶畫像、商品關聯度分析、輿情分析;

6、熟悉主數據、元數據、數據質量、和數據建模等數據治理相關的體系和方法;

7、具備較強的邏輯思維能力、數據敏感度,擅於利用數據發現問題及解決問題;

大數據架構師的基本職責 篇14

職責:

負責大數據平台架構的規劃和設計,主導系統的架構設計和核心模組開發,確保項目質量和關鍵性能指標達成;

負責大數據平台技術框架的選型與技術難點攻關,指導開發大數據平台的開發,保證大數據產品的上線運行;

負責深入理解業務需求,對業務建模,設計系統架構,滿足業務需求;

負責協助策略和算法工作,保障數據挖掘建模和工程化;

負責根據業務需求整合最佳化數據架構,保證產品的可靠性、穩定性;

負責指導開發人員完成數據模型規劃建設、分析模型構建及分析呈現;

負責研發技術發展方向,新技術領域的探索,將新技術套用到公司大數據平台,提升公司效能

任職要求:

本科及以上學歷,擁有5年以上大數據平台產品或分散式系統設計經驗,6年以上的開發經驗;

精通Hadoop,熟悉大數據生態技術,如Storm、Spark、Scala、Flume、Kafka、Zookeeper、Yarn、Sqoop、CDH、Solr 、Kylin、Impala、Hive、Hbase、Kerberos、Sentry等,有大規模集群架構、開發及運維經驗;

熟練掌握java/Scala語言,實現面向對象開發思想OOA,OOD,OOP;

熟悉linux作業系統,熟練掌握腳本言語Shell/Perl/Python等編碼語言;

熟練掌握數據倉庫設計,開發工作。能夠根據業務設計並開發數據倉。

具備源碼級問題解決和集群最佳化改造能力者優先;

能快速的學習新的開源框架和知識體系,並套用到現有架構體系中;

邏輯清晰,快速的學習能力,良好的溝通能力、團隊協調能力。

具備良好的團隊合作精神,較強的溝通交流能力,具備良好的技術領導能力;

具備良好的文檔撰寫能力和技術團隊管理能力

大數據架構師的基本職責 篇15

職責:

1. 規劃設計大數據平台整體架構,規劃各種組件,並且指導技術團隊完成相關係統驗證、安裝、部署、配置;

2. 負責制定大數據平台技術規範和接口規範,指導研發團隊按照規範進行系統開發;

3. 配合商務人員完成售前技術支持工作;

4. 完成其他與數據套用有關的技術工作;

任職要求:

1. 計算機相關專業本科學歷,5年以上工作經驗;

2. 對大數據技術棧有非常深刻的了解;具備架構設計的實際經驗;

3. 對信息安全架構設計及實施有一定的經驗;

4. 熟悉Linux、Windows等作業系統的安裝配置;

5. 熟悉網際網路套用的安裝配置;熟悉常見大數據技術棧組件的安裝配置;熟悉Visio等繪圖工具的使用;

6. 有衛生信息化建設經驗者優先;有容器安裝部署經驗者優先。

大數據架構師的基本職責 篇16

職責:

1、負責大數據項目平台架構的評估、規劃和設計

2、開發大數據平台的核心模組代碼,負責大數據平台的搭建,完成系統調試、集成與實施,保證大數據產品的上線運行

3、根據業務需求整合最佳化數據架構,保證產品的可靠性、穩定性

4、指導開發人員完成數據模型規劃建設,分析模型構建及分析呈現

5、深入研究大數據相關技術和產品,跟進業界先進技術;

6、根據項目要求編寫相關技術文檔;

7、負責大數據平台的架構評審,代碼評審,上線評審;參與數據套用需求、設計、審核和評審;

8、負責核心模組研發,負責大數據平台的搭建,完成系統調試、集成與實施;

9. 負責關鍵功能的開發,技術難題的解決,以及輸出代碼的關鍵把控;

10. 負責對使用關鍵技術的預研和選型,完成 PoC ;

11. 指導工程師完成開發工作,並能分享技術經驗。

任職資格:

1、精通Linux作業系統,熟練使用Java;

2、3年以上大數據項目實戰經驗,兩個項目的架構設計經驗,熟悉Hadoop、Hbase、Storm、Spark、Pig等開源框架,並熟悉其工作原理;

3、有Hadoop、Spark、Hbase平台性能調優經驗;

4、熟悉其它分散式存儲相關技術,包括HDFS,Hive、Redis、Mongodb、 Flume、Kafaka、Sqoop、Zookeeper、ElasticSearch等;

5、熟悉Java開發常用框架.如Spring、MyBatis等;

6、熟悉關係型資料庫如oracle及資料庫編程。

7、能夠根據項目情況安排人力、分配任務,具有較強的團隊管理能力。

8、碩士以上學歷,20xx年以上的工作經驗。