NLP实战高手课学习心得

NLP实战高手课学习心得,更多完整内容,一起来学习

NLP实战高手课学习心得

A2C和A3C:如何提升基本的PolicyGradient算法    

AlphaStar介绍:AlphaStar中采取了哪些技术?    

ASDL和AST    

AutoML及NeuralArchitectureSearch简介    

AutoML网络架构举例    

COMAAgent之间的交流    

DeepGBM:如何用神经网络捕捉集成树模型的知识    

DifferentiableSearch:如何将NAS变为可微的问题    

DirectPolictyGradient:基本设定及Gumbel-trick的使用116丨DirectPolictyGradient:轨迹生成方法    

Docker部署实践    

Docker简介    

Gumbel-trick:如何将离散的优化改变为连续的优化问题?    

ImitationLearning和Self-imitationLearning    

IMPALA:多Agent的Actor-Critic算法    

InductiveLogicProgramming:基本设定    

InductiveLogicProgramming:一个可微的实现    

Istio简介:Istio包含哪些功能?    

Istio实例和Circuit Breaker    

Kubernetes Ingress    

Kubernetes Stateful Sets    

Kubernetes部署实践    

Kubernetes服务发现    

Kubernetes灰度上线    

Kubernetes基本概念    

Kubernetes健康检查    

Kubernetes自动扩容    

LambdaCaculus概述    

Lambda-DCS概述    

Learning to optimize:是否可以让机器学到一个新的优化器    

LeNAS:如何搜索搜索space    

MCTS简介:如何将“推理”引入到强化学习框架中    

Model-basedReinforcementLearning    

PolicyGradient:如何进行PolicyGradient的基本推导?    

PPO算法    

Q-learning:如何进行Q-learning算法的推导?    

Quora问题等价性案例学习:深度学习模型    

Quora问题等价性案例学习:预处理和人工特征    

Rainbow:如何改进Q-learning算法?    

RENAS:如何使用遗传算法和增强学习探索网络架构    

Reward设计的一般原则    

RL训练方法RL实验的注意事项    

RL训练方法集锦:简介    

TransferReinforcementLearning和Few-shotReinforcementLearning    

Tranx简介    

WikiSQL任务简介    

层次搜索法:如何在模块之间进行搜索?    

超参数搜索:如何寻找算法的超参数    

多代理增强学习概述:什么是多代理增强学习?    

多模态表示学习简介    

解决SparseReward的一些方法    

使用增强学习改进组合优化的算法    

微服务和Kubernetes简介    

文本推荐系统和增强学习    

文本校对案例学习    

遗传算法和增强学习的结合    

增强学习的基本设定:增强学习与传统的预测性建模有什么区别?    

增强学习中的探索问题    

知识蒸馏:如何加速神经网络推理    

最短路问题和DijkstraAlgorithm    


首页
社科类
工科类
亲子类
心理情感类
目录
参与学习