職位描述
崗位職責(zé)1.負責(zé)OCR相關(guān)大模型(如文本檢測、識別、結(jié)構(gòu)化理解、多模態(tài)等方向)的算法研發(fā)、優(yōu)化及落地應(yīng)用。2.跟蹤學(xué)術(shù)界與工業(yè)界OCR領(lǐng)域的前沿技術(shù)(如Transformer-based模型、端到端系統(tǒng)、多語言支持等),推動技術(shù)迭代。3.針對復(fù)雜場景(如低質(zhì)量圖像、多語言、手寫體、表格、票據(jù)等)設(shè)計高效的OCR解決方案。4.參與大模型訓(xùn)練與調(diào)優(yōu)(包括數(shù)據(jù)構(gòu)建、分布式訓(xùn)練、模型壓縮、推理加速等)。5.與工程團隊合作,實現(xiàn)算法的高效部署,滿足性能、精度和穩(wěn)定性要求。6.輸出技術(shù)專利、論文或開源項目,提升團隊技術(shù)影響力。崗位要求1.計算機、數(shù)學(xué)、電子工程等相關(guān)專業(yè)碩士及以上學(xué)歷,3年以上OCR或深度學(xué)習(xí)研發(fā)經(jīng)驗。2.精通OCR領(lǐng)域核心技術(shù)(如CNN/Transformer、CRNN、Attention-based模型、DBNet等),熟悉主流框架(PaddleOCR、MMOCR等)。3.熟悉大模型技術(shù)棧(如LLM、多模態(tài)模型訓(xùn)練、****優(yōu)化、LoRA微調(diào)等),有實際項目經(jīng)驗者優(yōu)先。4.扎實的編程能力(Python/C++),熟練使用PyTorch/TensorFlow,熟悉分布式訓(xùn)練和性能優(yōu)化。5.具備較強的論文復(fù)現(xiàn)能力,能快速驗證新算法的有效性。加分項6.在ICDAR、CVPR等會議發(fā)表過OCR相關(guān)論文,或有開源項目貢獻。7.熟悉文檔結(jié)構(gòu)化、信息抽取(如LayoutLM、Donut等模型)。8.有海量數(shù)據(jù)訓(xùn)練或超大模型(10B+參數(shù)量)優(yōu)化經(jīng)驗。9.熟悉模型量化、剪枝、ONNX/TensorRT部署等工程化技術(shù)。
企業(yè)介紹
1、團隊:核心成員組成阿里,華為,百度
2、產(chǎn)品:輿情監(jiān)測方向
3、上海總部,武漢研發(fā)中心,北京分公司下半年
4、上海辦公地點:上海市靜安區(qū)彭江路大寧易園